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INTRODUCCIÓN 


Vx(L(x) —> P(x) A F(x) A0). Que nadie tema a esta broma leve, en unas 
pocas páginas será comprensible para cualquiera y lo que significa es esto: por 
mucho que tenga en su mente un autor, todo libro tiene un principio y, 
afortunadamente, un final. La fortuna es para el amable lector que, tras un tiempo 
finito, tendrá relativamente claro el conocimiento que me he propuesto transmitir, 
si he acertado en ello, y también para mi, liberado de escribir un Libro sobre Todo, 
tentación no tan infrecuente. 


Por tanto, evitaré al lector de estas líneas consideraciones aburridas sobre 
el buen conocimiento que, larga y gratificantemente he leído, escuchado, 
aprendido, hablado y enseñado. Lo verdaderamente interesante ahora debe ser que 
el conocimiento contenido en esta monografía es, en mi intención, una línea corta, 
clara y precisa que va de lo más elemental de la Lógica hasta las puertas de su 
aplicación en un lenguaje concreto de programación lógica. 


Esta intención se concreta de varios modos. He procurado que el material 
elegido fuera homogéneo y riguroso. Más rigor es más exigencia de comprensión, 
pero tiene un fruto: acorta y aclara la vía que lleva al fin pretendido. Por otro lado, 
no hay excursiones, más allá de las muy breves, a otras lógicas que no sean las 
teorías de primer orden, ni a otros cálculos, con sus correspondientes algoritmos y 
demostradores, que los que surgen naturalmente de la teoría y del propósito del 
texto. Propósito que apunta a terminar con un conocimiento transparente y preciso 
de los principios de la programación lógica. Principios porque son el primer paso 
en ese mundo y porque muestran sobre qué se fundamenta. Finalmente, he 
diseñado el itinerario para que nada lo interrumpiese, con el efecto de que algunos 
razonamientos se han adelgazado para que fueran pasos y no peñascos en el 
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camino, siempre manteniendo el contenido esencial y las referencias para un 
estudio mas pormenorizado y, podria decirse, mas ancho. 


Pero ¿qué es lo que realmente cuenta el libro? Pues la sintaxis de la lógica 
que la capacita para deducir teoremas; su semántica que hace que esos teoremas 
valgan a la hora de resolver un problema, el ejemplo de la lógica proposicional y, 
en un progresivo agudizamiento, la reducción de la sintaxis a cláusulas con las que 
el método de resolución (apoyado por la teoría de Herbrand) puede hacer 
demostraciones lógicas y procedurales a la vez, de forma que ya no hay más que 
un paso hasta el lenguaje PROLOG. Todo aderezado con algunos comentarios 
puntuales que pretenden abrir ventanas a un campo donde hay mucho que conocer 
a partir del núcleo que constituye el texto. 


La lógica, la resolución y la aproximación a la programación lógica dan 
título a los tres capítulos de la monografía. Tres apéndices más contienen algunas 
consideraciones que me han parecido útiles sobre la inducción y la representación 
del conocimiento, más una demostración desgajada del texto principal por su 
mayor longitud. El símbolo m señala el final de las demostraciones de meta 
teoremas. 


El maestro George Boole (Boole, 1847), y precisamente al citar las cartas 
de nuestro compatriota José Blanco White, hablaba, en 1847, de la íntima conexión 
entre la lógica y el lenguaje, “sólo es posible la Lógica... concibiendo predicados 
y nombrándolos con palabras” y, como muestra de que esto no era una reflexión 
más, desarrolló su Análisis Matemático de la Lógica como un álgebra que traducía 
las palabras de nuestros razonamientos. Más o menos conscientemente, todos 
compartimos la convicción de que el pensamiento, la lógica y las palabras están 
esencialmente unidos. En ese sentido, he tenido un cuidado especial con las 
palabras en lo que podríamos llamar contenido técnico del libro y, por otra parte, 
he procurado que en su forma fuera preciso, claro y, en lo posible, elegante. 


En el nivel básico en que se sitúa este texto no se puede hablar mucho de 
escuelas y corrientes. No presento doctrina sino una ciencia cuyos rasgos 
fundamentales son iguales en todos los autores y por lo que pocas páginas de este 
texto no tienen algo en común con las de otros bien conocidos y respetados 
manuales. Las divergencias afectan sobre todo a algunos resultados originales, a la 
terminología y a ciertas cuestiones de método de exposición. Cuando ha sido 
posible, me he atenido a lo comúnmente admitido y en algunos puntos donde 
parecía conveniente o era necesario elegir, he adoptado los axiomas y reglas de 
Joseph R. Shoenfield en su ya clásico Mathematical Logic (Shoenfield, 2001) y he 
adaptado a mi tratamiento de la demostración (como también hacen otros textos) su 
uso del concepto “consecuencia tautológica”, contrapuesto al de consecuencia 
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lógica, por su precisión, elegancia y efectividad. No es este último uso el más 
generalmente aceptado, pero pienso que merece la pena el giro que imprime a una 
parte de la materia, como habrá ocasión de explicar detenidamente. 


He escrito esta monografía con el fin de que pueda ser un texto atractivo 
para cualquier lector inclinado a las matemáticas, la lógica y los fundamentos de su 
automatización. Partes de la misma se han utilizado en diversos cursos impartidos 
en centros de las universidades Complutense y Politécnica de Madrid, así como, 
entre otros, en la Fundación Ramón Areces y la Escuela de la Hacienda Pública de 
Madrid. En su forma actual puede servir para un primer curso de un semestre o 
algo más en centros superiores de Informática y otros que cuenten con estudios de 
Lógica que, como ya ocurre frecuentemente, no estén orientados a su pura vertiente 
filosófica. Tanto a estudiantes de primeros cursos como a informáticos más o 
menos amateurs o profesionales que no han tenido una formación explícita en este 
aspecto lógico de su trabajo, el texto les puede proporcionar una introducción a la 
Lógica con un bien fundamentado acceso teórico a algunas funciones informáticas 
de la misma. 


Ser agradecido es una obligación y, en mi caso, una satisfacción. Lo único 
malo es que siempre hay que contar con la posibilidad de olvidar a alguien. Lo que 
he recibido de mis lecturas, conversaciones, estudios y docencia está por debajo de 
la superficie de este trabajo, pero no por ello son menores su realidad y mi 
reconocimiento. Para mí no es ningún tópico que los alumnos no sólo estimulan 
sino que amplían y profundizan aquello que conocemos. Para ellos mi primer 
reconocimiento explícito. Quienes han convivido conmigo mientras este texto se 
gestaba, mi esposa, Paloma, y mi hija Teresa me han dado comprensión, apoyo, 
paciencia y más de una idea. Detalles imperceptibles a primera vista, pero 
fundamentales cuando se considera el todo del libro, se los debo a múltiples 
conversaciones con mis colegas de la Facultad de Informática de Madrid; Julio 
García del Real Ruizdelgado se ha tomado, además, la molestia de leer, opinar y 
discutir partes sustanciales del libro; y el aliento de Jesús García Tomás y Jesús 
Cardeñosa ha contribuido positivamente a mi trabajo. El aspecto editorial, que es lo 
primero que se ve, pero que luego fácilmente se olvida, me parece de gran 
importancia y se debe exclusivamente a RA-MA Editorial y, en particular a Luis 
San Losé, Raquel Ferrero y Jesús R. Galán. 


Capítulo 1 


TEORÍAS DE PRIMER ORDEN 


La fuerza de la Lógica Formal reside en su capacidad para, como 
enseguida explicitaremos más, deducir precisa y, en muchos casos, 
mecánicamente, ciertas expresiones simbólicas nuevas a partir de otras anteriores. 
Las expresiones inferidas son los teoremas de las teorías de la Lógica; el estudio 
pormenorizado del lenguaje en que se va a escribir todo, la propia deducción y sus 
herramientas, son elementos fundamentales de lo que se conoce como la parte 
sintáctica de la Lógica y es el contenido de la primera Sección, 1.1, de este 
capítulo. 


La utilidad de la Lógica Formal, por otra parte, está en que a los teoremas 
de sus teorías se les puede asignar significados en el mundo real y en particular en 
el dominio de algún problema que nos ocupe. De esta forma las deducciones 
sintácticas (simbólicas) pueden dar lugar a soluciones de problemas reales 
mediante el proceso de dotar de una semántica a la teoría de que se trate. Con esta 
palabra, semántica, se llama al conjunto de instrumentos de asignación de 
significados al que nos hemos referido y de ella trataremos en la Sección 1.3 de 
este capítulo. Notemos también, que al igual que en la Lógica, la Informática 
subraya desde lo más elemental la estricta separación entre sintaxis y semántica de 
los lenguajes de programación. El interés por precisar y distinguir ambos conceptos 
va a determinar en una parte muy importante el estilo de partes sustanciales de este 
libro. 


En la experiencia cotidiana y de manera más o menos formal aparece el 
hecho de deducir conocimiento (un hecho, una frase, una propiedad) a partir de 
otro conocimiento que se considera dado o previo. En el extremo más formal, no 
pondrá en duda ese hecho nadie que conozca la Lógica, por supuesto, ni tampoco 
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quienes hayan estudiado Matemáticas o Física o más allá del nivel elemental, o 
algunas otras disciplinas de la Informática o la Ingeniería en general. 


Por otra parte, todos usamos estructuras lingüísticas tales como “si este fin 
de semana nieva y he terminado el balance, iré a esquiar” que, más tarde, podrían 
completarse con “nieva y he terminado el balance, así que iré a esquiar”. Si 
representamos, respectivamente, “nieva” por el símbolo N, “terminar” por T, 
“esquiar” por E, la conjunción copulativa por A, la consecuencia por la flecha > y 
damos ciertas reglas sintácticas y de procedimiento, las frases pasan a ser algo 
formal: 


sSiNAT>E yN. yT entonces E 


(casualmente cuatro ejemplos de una de las protagonistas de nuestro texto, las 
cláusulas de Horn). Todo el proceso seguido expresa perfectamente el corazón de 
lo que es un sistema formal o axiomático: el edificio científico que contiene unos 
conceptos y aserciones básicos (axiomas) y otros (teoremas) derivados de los 
primeros mediante definiciones y pruebas que deben ajustarse a ciertas reglas y 
que permiten expresar con todo rigor lo que comúnmente se entiende como 
inferencia axiomática. Los conceptos y aserciones básicos deben ser tan sencillos y 
claros como sea posible, los demás se pueden complicar potencialmente hasta el 
infinito. 


Si, por un momento, dejamos de lado el aspecto pragmático que todo 
sistema formal científico tiene en algún grado, puede ser muy ilustrativo considerar 
los sistemas formales conjuntamente con juegos de alguna complejidad. Un juego 
de damas, ajedrez o cartas tiene un lenguaje propio, una jerga frecuentemente 
intocable y con ella designa, entre otras cosas, elementos básicos que no requieren 
explicación: las fichas, los tableros o las cartas. Por otra parte, el inicio del juego es 
un hecho que ni se cuestiona ni se justifica, pero las situaciones que le siguen se 
deducen estrictamente a partir de la inicial por las reglas del juego que son tan 
férreas como las especificaciones de una demostración en un sistema formal. Al 
menos así es para los jugadores que se tienen por más ‘puros’. 


Toda la Lógica que vamos a exponer en esta monografía no es más que un 
conjunto de sistemas formales. Esperamos que esto resulte muy claro para el caso 
de las Teorías de primer orden y la Lógica de proposiciones como caso particular. 
En el tratamiento que hemos escogido para el llamado método de la resolución, el 
carácter de sistema formal queda algo oscurecido por el objetivo tan concreto para 
el que se define, pero es un sistema formal de pleno derecho que, curiosamente, 
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carece de axiomas lógicos, aserciones básicas aceptadas siempre y a las que nos 
referimos más arriba. 


Como puede colegirse de lo anterior y finalmente, aunque no con menor 
importancia, queremos subrayar que la Lógica formal no debe sustituir ni mucho 
menos ir contra el sentido común y la lógica del hombre de la calle. Todo lo 
contrario: este estudio, y cualquier otro por muy avanzado que sea, sería un juego 
estéril si no sirviera para potenciar y explicitar esa lógica natural en nuestros 
lectores o quienes utilicen este texto para su formación. 


1.1 TEORÍAS DE PRIMER ORDEN 


En el ejemplo precedente nos hemos quedado satisfechos con la 
representación formal, N A T — E, N, T y E, de las frases de partida que estaban en 
lenguaje natural. 


Cuando se continúa por ese camino se topa antes o después con la limitada 
expresividad de los lenguajes formales. Supongamos, por ejemplo, que queremos 
representar el argumento: “del hecho de que los que terminan su trabajo van a 
esquiar se concluye que Juan, que termina su trabajo, va a esquiar”. Una 
representación sin variables como la anterior sería estéril. Tendríamos algo así “de 
T — E y J se concluye F” donde los símbolos representan “los que terminan...”, 
“esquían”, “Juan termina...” y “Juan esquía”. Aunque no hayamos dado los 
detalles de la deducción de E a partir de N, T y N A T > E, en el primer ejemplo, 
no es difícil intuirlos al menos informalmente. En el segundo caso, sin embargo, 
mal podremos establecer una conexión entre T, E, J y F y, por ello, deberíamos 
haber desechado la representación T, E, J, F y escribir en su lugar algo así: 


de Vx (T(x) — E(x)) y TG) se concluye E(j) (V se lee “para todo”) 


donde se expresa al menos que estamos hablando de los mismos hechos, terminar y 
esquiar, pero unas veces atribuyéndolos a un individuo genérico y otras a Juan. 
Esta segunda clase de símbolos son los materiales de los lenguajes de las teorías de 
primer orden que aquí estudiamos. Un caso particular de las mismas, el cálculo de 
proposiciones, será aquel en el que no aparecen variables ni constantes como 
argumentos de otros símbolos (el primer ejemplo). Esto debe empezar a hacer 
entrever que. los lenguajes de las teorías de primer orden en general tienen mayor 
poder expresivo que los del cálculo de proposiciones. 


Desgraciadamente ese mayor poder no lo puede todo ni está exento de 
paradojas. Consideremos la frase “es bastante necesario que termine el trabajo para 
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que pueda ir a esquiar. Casi he terminado el trabajo. ¿Tendré que no esquiar o 
esquiaré?”. Los adverbios “bastante” o “casi” introducen matices que un lenguaje 
de primer orden no sabe reflejar, así como tampoco la diferencia entre “poder 
esquiar” “tener que esquiar” y “esquiar”. La frase “si soy millonario entonces tengo 
dos pulmones” será correcta en la mayoría de los casos, pero plantea problemas a 
la hora de diseñar un formalismo de representación del conocimiento. 


Por fortuna, se ha desarrollado una gran cantidad de lógicas no clásicas 
(distintas de las teorías de primer orden o cálculo de predicados) en las que el 
poder expresivo aumenta considerablemente. Si el problema lo requiere, se pueden 
utilizar incluso métodos de deducción en disciplinas distintas de la Lógica como, 
por ejemplo, la inferencia probabilística. 


Ejemplos de lógicas no clásicas son las lógicas temporales, modales, 
multivaluadas, difusas, no monótonas, etc. El punto de partida y la referencia de 
todas ellas es la lógica clásica que aquí vamos a estudiar. Las no clásicas no son 
objeto de esta monografía. El lector interesado puede consultar (Turner, 1984), o 
las referencias de algún buen tratado sobre Inteligencia Artificial actualizado y 
extenso como (Russell, Norvig, 2004). 


1.1.1 Lenguajes de primer orden 


Definiciones 


Se consideran dados unos conjuntos numerables y disjuntos F; y P; donde j 
puede ser cualquier número natural, incluido el 0. Los elementos de Fj se conocen 
como símbolos de función j-aria y los de Pj como símbolos de predicado j-ario. 
Los símbolos de función cero-aria se llaman constantes y los símbolos de 
predicado 0-ario proposiciones. 


Definición 1. Los símbolos de un lenguaje de primer orden, L, son 


e Los elementos de un conjunto numerable V llamados variables: x, y, z, u, v, w, 
... con o sin subindices y con un orden fijo que llamaremos alfabético, 
Los elementos de los conjuntos F; y P; y 
Los símbolos — (negación), v (disyunción) y F (cuantificador existencial). = y 
v se conocen como conectivas. 


Entenderemos por n-tupla o, simplemente, tupla en un conjunto A 
cualquier lista (ordenada) (a,, a,, ..., a,) de elementos de A. Dado que sólo hay una 
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cero-tupla, (), las funciones cero-arias sólo toman un valor y ésa es la razón de que 
se identifiquen las constantes con los símbolos de función cero-aria. De la misma 
forma, y puesto que los predicados se identifican con conjuntos (las n-tuplas que 
los verifican), sólo hay dos predicados 0-arios: (0) y {} (el vacío) que 
denotaremos como es habitual por V y F, así como más adelante veremos que V y 
F serán los dos únicos significados de las proposiciones, los símbolos de predicado 
0-ario. Los conceptos de función y predicado se definen formalmente en las 
primeras definiciones de la sección dedicada a la semántica, 1.3. 


Ejemplo 1. El lenguaje del cálculo de proposiciones es el caso particular 
en que no hay variables ni símbolos de función ni cuantificadores y los únicos 
símbolos de predicado son los 0-arios, proposiciones. Según la Definición 2, un 
poco más abajo, esto implica que el lenguaje del cálculo de proposiciones también 
carece de términos. 


Como ya observamos en la introducción de este capítulo, éstos no son los 
únicos símbolos del lenguaje. Probablemente el lector eche de menos otros muy 
conocidos algunos de los cuales hemos usado en los primeros ejemplos de este 
mismo capítulo. Enseguida presentamos la definición de símbolos derivados que, 
pueden hacer más transparente la expresividad del lenguaje. No se han incluido en 
la primera relación de símbolos por un principio de economía: todos los símbolos 
se pueden definir a partir de un subconjunto de los mismos que, en cierto sentido, 
es mínimo. 


Una expresión de un lenguaje de primer orden, L, es cualquier cadena 
finita de símbolos de L. Nos interesan dos grandes clases de expresiones, términos 
y fórmulas, que definimos a continuación. 


Definición 2. Términos de un lenguaje de primer orden 


Los términos en forma prefija, o simplemente términos, de un lenguaje de 
primer orden se definen como el conjunto mínimo de expresiones de L que 
satisfacen las dos condiciones siguientes. 


e las variables son términos. 


e si a, a, .. a, son términos y f es un símbolo de función n-aria, 


entonces fa ¡A 4, es un término. 


Según esta definición, las constantes, que son símbolos de función cero- 
aria, son términos por sí solas. 
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Formas infijas y paréntesis para términos. Si f es un símbolo de función 
binaria o n-aria y a y b, o A, A, es A, SON términos, definimos que afb y fía, a 
nee a) son, respectivamente, fab y f a, a, .. 2 


Ejemplo 2. Términos de la Aritmética formal 


En el lenguaje para referirse simbólicamente a la aritmética de los números 
naturales donde aparece la constante 0, el símbolo de función uno-aria s (para 
referirse a la función sucesor, sumar uno) y el símbolo de función binaria +, son 
ejemplos de términos las expresiones siguientes. Al final de cada ejemplo se 
escribe el mismo, pero en forma infija, o con paréntesis, o con ambos 
procedimientos: 


x, variable; 

0, constante; 

+x0, símbolo de función binario, +, y dos términos, x y 0, x+0; 

s0, símbolo de función 1-ario, s, y un término, 0, s(0); 

s+xy, símbolo de función 1-aria, s, y un término, +xy, formado a su vez por un 
símbolo de función binario, +, y dos términos, x e y, s(x+y); 

e ss0, s(s(0)). 


Se suelen usar los símbolos 1, 2, etc. para abreviar las expresiones s0, ss0, 
etc. 


Definición 3. Fórmulas de un lenguaje de primer orden 


Las fórmulas en forma prefija, o simplemente fórmulas, de un lenguaje de 
primer orden se definen como el conjunto mínimo de expresiones de L que 
satisfacen las dos condiciones siguientes. 


(a) Si p es un símbolo de predicado n-ario y a, a, ..., a, son términos, p a, 


de 


a, ... a, es una formula. A este tipo particular de fórmula se le llama fórmula 


atómica o átomo. 
(b) si A y B son fórmulas, entonces también son fórmulas: 


aA 
VAB 
HA. 
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Definición 4. Extensión del vocabulario, formas prefijas, infijas, 
paréntesis y convenios para fórmulas 


Las expresiones definidas, términos y fórmulas, llevan el apelativo de 
“forma prefija” debido a que los símbolos que las especifican, f, p, =, V y 3, 
preceden a los demás símbolos que intervienen en las mismas. Esta forma de 
escribir es totalmente precisa, carece de ambigiiedad y, por tanto, no requiere 
paréntesis. Sin embargo, también hemos visto ejemplos de términos en forma infija 
y, en esa línea, vamos, por un lado, a ampliar el vocabulario y, por otro, a permitir 
el uso de formas infijas también para fórmulas. Aunque en muchas ocasiones esto 
requiera el uso de paréntesis, son notaciones que pueden resultar más intuitivas y 
evocar la forma usual de utilizarlas. 


Definimos que 


A>B es la fórmula (A)vB 

ANB es la formula {A —-B) 
A@B es la formula (A =B) ^ (B > A) 
Vx A es la formula =—Kk-4 


y diremos que — (implicación), A (conjunción), +> (doble implicación) y V 
(cuantificador universal) son símbolos derivados de cualquier lenguaje de 
primer orden L. 


En aras de una escritura que resulte familiar y sin ambigiiedades usaremos 
libremente los paréntesis, pero en algunos 'casos hay convenios que aligeran la 
escritura de las fórmulas sin restar transparencia. 


Por lo que se refiere a las fórmulas, adoptamos los siguientes convenios. 


e Si una formula A de L puede ser una disyunción (o una conjunción) o 
bien una implicación (o una doble implicación) se conviene que A es 
una implicación (o una doble implicación). 

e Si A puede ser una negación (o una fórmula cuantificada) o bien una 
disyunción (o una conjunción) se conviene que Á es una disyunción (o 
una conjunción). 

e Sip es un símbolo de predicado binario, a y b son términos y A y B son 
fórmulas, definimos que apb, apb y AvB son, respectivamente, pab, 
=pab y VAB. 

e Sip es un símbolo de predicado n-ario y a, 4, ..., 4, son términos 


definimos que p(a, a, ..., a,) es la fórmula p a, a,... a 
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e A, VA, Va Apy VA, es la formula Av (A, V(... (A, , VA, )) 
e A, NA, NA, NA, eslafórmulaANM(A,N(... (4, , NA))) 
© A, 74, 23... A, , >4, es la fórmula A> (A, >(... (4,, >4,)) 


Nota 1. Sobre las cadenas de implicaciones 


Nótese que, por definición de implicación y de conjunción, tanto esta 
última fórmula como (A, A A, A... A, ) > A, son (salvo un número finito de 
pares de negaciones consecutivas) la fórmula = A, v = AV A AY 


como veremos que son semánticamente equivalentes, puede decirse informalmente 
que 


“A, SA, >: A, 2A, significa (A, AA, A... A, ,)>A,” 


Los dos primeros convenios de la anterior lista se conocen como 
“Jerarquía de conectivas y cuantificadores” puesto que establecen prioridades 
entre los mismos: en caso de ambigiiedad una fórmula o subfórmula es en primer 
lugar una implicación (o una doble implicación), si cabe el caso; si no aparecen 
esas conectivas, será en primer lugar una disyunción (o una conjunción); en último 
lugar quedan la negación y la cuantificación. Así la fórmula 


axBvCoD 
podria entenderse como 


1. 3x (B v (C & D))o bien 


2. 3x((B vC) D)o bien 
3. dx(BvC)@Do bien 
4. 3xBv(C& D)o bien 
5 ExBvC)oDpD. 


Sin embargo, es positivamente esta última fórmula porque (en virtud de la 
jerarquía de conectivas y cuantificadores) debe ser una doble implicación, lo cual 
excluye 1, 2 (fórmulas cuantificadas) y 4 (disyunción); la subfórmula 3x B v C, a 
su vez, debe ser una disyunción, lo cual excluye 3 (fórmula cuantificada) y nos deja 
sólo la fórmula 5. 
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Nota 2. Lenguajes igualitarios 


Los lenguajes que, como el del ejemplo que sigue, utilizan el símbolo de 
predicado igualdad, = (lenguajes “igualitarios”), requieren un tratamiento especial, 
que aquí todavía no se percibe porque afecta a los axiomas de las teorías que los 
utilizan y a su semántica. Véase la Nota 2 de 1.1.2 y la Nota 1 de 1.3.1. 


Ejemplo 3. Fórmulas de la Aritmética formal 


En el mismo lenguaje de la aritmética que vimos en el Ejemplo 2, y donde 
aparecen también los símbolos de predicado binario = y <, son ejemplos de 
fórmulas las siguientes expresiones (al final de cada ejemplo se escribe el mismo, 
pero en forma infija, o con paréntesis, o con ambos procedimientos): 


e <0x, fórmula atómica: símbolo de predicado binario, <, y dos términos 0 y x, 
0<x; 

e ~=sx0, negación de fórmula atómica, =sx0, que a su vez está formada por un 
símbolo de predicado binario, =, y dos términos, sx y. 0, s(x) #0; 

e Hh=xsy, Z (x = si); 

e v<xy=xy, disyunción de dos fórmulas (atómicas), <xy e =xy, (x<y) v (x=y). 


Sustituciones 
Definiciones 5. Variables libres y ligadas. Fórmulas cerradas 


Se llama estancia de una variable x en un término b o una fórmula A a la 
propia variable x situada en cualquiera de las posiciones en las que se encuentre en 
b, o A, si las hay. Así, x tiene cuatro estancias en la fórmula 


Vx p(x,x) > p(x,0), 


la que esta inmediatamente a la derecha del cuantificador universal y las tres que 
están en el ámbito del símbolo p; mientras que cualquier otra variable, y, z, etc. no 
tiene estancias en esta fórmula. 


Análogamente x tiene dos estancias e y una en el término x+(x+y+1) donde 
suponemos que el símbolo 1 es una constante. 


Usaremos la expresión subfórmula en su sentido intuitivo que puede 
formalizarse fácilmente por una definición inductiva. 
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El conjunto de las variables ligadas de una fórmula A está formado por 
aquellas variables que tienen una estancia en una subfórmula de A de la forma 
3xB, si x es la variable en cuestión. 


El conjunto de las variables libres de una fórmula A está formado por 
aquellas variables que tienen una estancia en una subfórmula de A que no es de la 
forma 3xB, si x es la variable en cuestión. 


Nótese que las definiciones anteriores permiten que una variable de una 
fórmula sea ligada y también libre. Así, x está libre y ligada en la fórmula Vxp(x,x) 
> p(x,1), que, como sabemos, es una abreviatura de “x= p(x,x) > p(x,1), pues 
las tres primeras estancias de x son ligadas, mientras que la última es libre. 


Una fórmula cerrada es aquella que no tiene variables libres. 


El objetivo de todas estas definiciones es poder sustituir ciertas estancias de 
variables por otros términos sin desvirtuar la expresión donde se encuentren. 


Definición 6. Sustitución en un término 


Si b es un término, x una variable y a otro término, definimos b,fa] como 
el resultado de sustituir todas las estancias de x en b por el término a. 


Por lo que se refiere a fórmulas hay que cuidarse de sustituciones que 
cambien el sentido de la fórmula. La primera situación de esa clase sería pasar de 
Vx p(x,x) > p(x,e), con e una constante, a Ve p(x,x) > p(x,e) o a Vx p(e,e) > 
p(x,e) por una supuesta sustitución de x por e. Ninguna de las dos fórmulas parecen 
admitir significados interesantes, aunque aún no hayamos hablado del significado 
de un lenguaje L. “Para todos los una constante (?)” y “para todo los x se cumple p 
de una constante” no son afirmaciones que cabría esperar de una lógica de la que 
hemos proclamado que ha de potenciar el sentido común. El problema ha aparecido 
al sustituir variables ligadas y por tanto la única sustitución correcta y que 
mantiene el sentido de la fórmula original es Vx p(x,x) > p(e,e). 


Otra situación más sutil aparece si se cambia la fórmula Sy padre_de(x,y) a 
la nueva fórmula 3y padre_de(y,y). Se ha respetado la limitación de sustituir sólo 
variables libres, x en este caso, pero hemos pasado de “cualquiera tiene un padre” a 
“alguien es el padre de sí mismo”. Sobran comentarios. 
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Definición 7. Sustitución en una fórmula 


Considerando todo lo precedente, si A es una fórmula, x una variable y a 
un término tal que no contiene ninguna variable ligada en ninguna subfórmula de 
A donde x esté libre (definición de que x es “sustituible” por a), definimos A,f{a] 
como el resultado de sustituir todas las estancias libres de x en A por el término a. 


Nótese que si se pretende sustituir x por y en la fórmula anterior, A = 
dypadre_de(x,y), a es la propia y, a contiene a y (coincide con a) e y está ligada en 
la subfórmula de A que es la propia A y donde x está libre. Por tanto x no es 
sustituible por y en A. 


Nota 3. La sustitución de varias variables se define igualmente con la 
advertencia de que se debe realizar simultánea y no sucesivamente. 


Se puede evitar la condición de “sustituible por”, un tanto complicada, 
mediante el cambio de nombres de las variables cuantificadas que garantiza los 
mismos efectos. Que este cambio produce una fórmula equivalente y en qué 
sentido o sentidos es parte del contenido del Teorema 1 de la sección 2.1.1 del 
Capítulo 2 junto con el teorema de completud, Teorema 1 de la sección 1.4. 


Cuando no haya lugar a confusión escribiremos A(X,, X,, ..., X,) para poner 
de manifiesto todas las variables libres de una fórmula A, no necesariamente 
atómica (A no tiene que ser un símbolo de predicado). Al mismo estilo de escritura 
corresponden las expresiones A(t, ty ees ths Xp“ x), que es A Kies x lt» Ls es 
t] donde k satisface 1 <k <n, y A(€1,€2,...,€n) que es A x,x7, .., xp 109 €z» ===> €,)- 


Ejemplo 4 
Si b es el término x+(x+y+1), b,[1] es 1+(1+y+1). 


Para la fórmula A(x) = Vx p(x,x) > p(x,e), que ya consideramos más 
arriba, A,[e] = Vx p(x,x) > p(e,e) = A(e). 


La fórmula B(x) = 3y padre_de(x,y), también ya considerada, se puede 
tratar según la segunda nota anterior, a expensas de la posterior justificación. 
Cambiamos .el nombre de la variable cuantificada, y, para tener B(x) = 
Azpadre_de(x,z) y ya se puede sustituir legalmente x por y obteniendo B(y) 
3zpadre de((y,z), que es lo mismo (salvo el cambio de nombre) que dictan la 
definición y el sentido común. 
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1.1.2 El sistema formal teorias de primer orden 


Definición 1. Se llama teoría de primer orden, T, a un sistema formal 
definido por: 


(a) el lenguaje de T, L(T), es un lenguaje de primer orden, 


(b) el conjunto de los axiomas de T esta formado por las formulas de alguna de 
las dos formas siguientes 


e —A VA, axiomas proposicionales 

e Ay/[a] > X A, axiomas de sustitución 

e mas algunas fórmulas seleccionadas para formar parte de los axiomas 
y que se llaman axiomas no lógicos. (Los dos esquemas anteriores 
están en cualquier teoría de primer orden y, por ello, se llaman 
axiomas lógicos.) 


(c) El conjunto de las reglas de inferencia que permiten deducir unas fórmulas 
a partir de otras está formado por las cinco reglas lógicas siguientes. 


e Regla de expansión por la que se infiere B v A de la formula A 

e Regla de contracción por la que se infiere A de la fórmula A v A 

e Regla asociativa por la que se infiere (A vB) v C de la fórmula A v (B 
vC) 

e Regla de corte por la que se infiere B v C de las fórmulas A vB y A v 
C 

e Regla de introducción del cuantificador existencial por la que se infiere 
HA >B de la fórmula A > B, si x no está libre en B 


Se acostumbra escribir estas reglas esquemáticamente de la siguiente forma: 


A expansión AvA contracción 
BvA A 
Av(BvC) asociativa AYB AVE corte 
(AvB)vC BvC 


A>B,xnolibreenB introducción del 7 
IXA>B 


donde, encima de la línea horizontal, figuran la fórmula o fórmulas de las que se 
parte, premisas o hipótesis, y, debajo de dicha línea, se coloca la fórmula deducida 
mediante la regla correspondiente, la conclusión. 
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El Cálculo de predicados, Lógica de predicados o Lógica de primer orden 
es una teoría de primer orden sin axiomas no lógicos, pero en cuyo lenguaje están 
todos los símbolos no lógicos de función y predicado. 


Nota 1. Símbolos lógicos y no lógicos 


En el mismo sentido de la distinción anterior entre axiomas lógicos y no 
lógicos, las variables y los símbolos =, v y 3 se llaman símbolos lógicos debido a 
que están en todo lenguaje de primer orden, mientras que los símbolos de función y 
predicado se llaman símbolos no lógicos porque, por definición, pueden encon- 
trarse o no y en cualquier cantidad en cada lenguaje particular. 


De todo lo dicho resulta que para definir una teoría, T, basta dar los 
símbolos no lógicos de L(T) y los axiomas no lógicos. Escribiremos T[A, B, C, ...] 
para representar la teoría cuyos axiomas no lógicos son A, B, C, ... 


Nota 2. Teorías con igualdad 


“n 


Cuando en L(T) está el simbolo de predicado binario el uso admitido 
es que se añadan los dos axiomas lógicos siguientes a los axiomas proposicional y 
de sustitución. 


e axioma de identidad que es una fórmula de la forma x = x 
e axioma de igualdad que es una fórmula de la forma 
A SY AR TY ey 
o bien 
A A eV A a Y, 
donde f es un símbolo de función n-aria y p un símbolo de predicado n- 
ario. 


n 


En su momento también se modificará la semántica para los lenguajes con 
igualdad. Véase más adelante la Nota 1 en 1.3.1. 


Nota 3. Lógica de proposiciones 


Se llama así al caso particular de una teoría de primer orden en la que no 
hay variables, ni cuantificadores, ni más símbolos de predicado que los 0-arios 
(véase el lenguaje de la Lógica de proposiciones en el Ejemplo 1 de 1.1.1), ni, 
naturalmente, cuenta con el axioma de sustitución ni la regla de introducción del 
cuantificador existencial. Se acostumbra llamar proposiciones a las fórmulas 
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atómicas de la Lógica de proposiciones. La Lógica de proposiciones se estudia con 
algún detalle en la sección 1.5 


Definición 2. Teoremas 


Como en cualquier sistema formal, definimos así los teoremas de una 
teoría de primer orden. 


Los teoremas de una teoría de primer orden, T, se definen como el conjunto 
mínimo de expresiones de L que satisfacen las dos condiciones siguientes. 
(a) Los axiomas de T son teoremas de T, 


(b) si las hipótesis de una regla son teoremas de T, la conclusión es teorema de 
T. 


Escribiremos abreviadamente T | F en lugar de “F es un teorema de T” o 
T[A, B, ...] H F en lugar de “F es un teorema de T[A, B, ...]”, si conviene 
explicitar los axiomas no lógicos de la teoría en cuestión. También se dice que F se 
deduce de, respectivamente, T o T[A, B, C, ...]. 


Ejemplo 1. Una demostración 


Si A y A > B son axiomas de una teoría T, podemos generar una lista de 
teoremas de T de la siguiente forma. 


1.A>B es teorema porque es axioma no lógico 

2. Av B es el mismo teorema por definición de > 

3.A axioma no lógico (a partir de aquí omitimos la oración “es 
teorema porque es”) 

4.BvA (resulta por aplicación de la) regla de expansión a 3 

5.-BvB axioma proposicional 

6.AVB regla de corte a 4 y 5 (también omitimos “resulta por 
aplicacion...”) 

7.BvB regla de corte a 6 y 2 

8.B regla de contracción a 7. 


Como ya hemos adelantado, las ocho fórmulas de la lista anterior son 
teoremas de T: todas verifican que son axiomas o que se obtienen de otros 
teoremas previos por aplicación de reglas; y ésa es la definición de teorema. Al 
mismo tiempo, hemos obtenido un ejemplo de demostración o prueba en T. 
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Definición 3. Demostración o prueba 


Una demostración en T[A, B, C, ...], o demostración a partir de las 
fórmulas A, B, C, ... , es una sucesión finita de fórmulas F ¡Ey -- F, tales que F,, 
para todo i entre 1 y k, o bien es un axioma de T[A, B, C, ...J, o bien es la 
conclusión de alguna regla aplicada a fórmulas anteriores de la demostración. 


A estas demostraciones se les llama también demostraciones sintácticas en 
contraposición a los procedimientos semánticos que veremos en la sección 1.3 y 
muchas de las siguientes y para subrayar que sólo depende de los símbolos que 
aparecen en axiomas y reglas, la cara sintáctica de la Lógica. 


Ejercicio 1. Demuéstrese que una fórmula A de L(T) es teorema de T si y 
sólo si es la última fórmula de una demostración en T (se dice que ésta es una 
demostración de A en T). 


Nota 4. Consistencia e inconsistencia 


No parece natural ni deseable que todas las fórmulas del lenguaje de una 
teoría sean teoremas de la misma. Podríamos demostrar 1<0 y también —(1<0) en 
la misma teoría. Esto, que no ocurre en una teoría diseñada para razonar sobre un 
problema real (como la teoría de la aritmética), sí puede ocurrir en algunas teorías 
que se usan instrumentalmente para fines distintos, pero muy importantes, como 
veremos, por ejemplo, al hablar de resolución. Los términos consistencia e 
inconsistencia sirven para distinguir las dos situaciones a las que nos estamos 
refiriendo. Se dice que una teoría de primer orden, T, es inconsistente si en T se 
puede probar T H AyT H —A para cierta fórmula A o, lo que es equivalente, si 
para toda fórmula A de L(T) se puede probar T H A. Se dice que T es consistente 
si no es inconsistente (no se puede demostrar que toda fórmula es teorema ni que A 
y =A son teoremas). La demostración de la consistencia de la Lógica de primer 
orden fue un capítulo sobresaliente de la Lógica que se cerró con uno de los 
famosos teoremas de Gödel como explicamos en la sección 1.4, Teorema 2. 


Cuando más adelante dispongamos de las herramientas adecuadas (véase el 
Ejercicio 7 de 1.1.3) demostraremos que las dos definiciones de inconsistencia 
(demostrar A y ~A o bien demostrar cualquier fórmula) son equivalentes. 


Nota 5. Reglas derivadas 
La demostración 1-8 del ejemplo 1 anterior prueba dos nuevas reglas que, 


en consecuencia, llamaremos derivadas. La primera establece que si A y A > B 
son teoremas de cierta T, se puede deducir que B es un teorema de T. Este hecho se 
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conoce como la regla derivada Modus Ponens que se escribe, con la misma 
notación de las reglas lógicas, 


ALAB 
B 


La segunda regla derivada que hemos obtenido como la parte de 4-6 de 
dicha demostración establece que si B v A es un teorema de cierta T, se puede 
deducir que A v B es un teorema de T, o bien (regla conmutativa), 


BvA 
AvB 


que, dado el papel simétrico de las fórmulas A y B, se suele escribir 


AvB 
BvA 


Muchas otras reglas derivadas aparecen en los resultados de la sección 
siguiente. 


1.1.3 Meta teoremas. Reglas y teoremas derivados 


Se llama meta teoremas a los resultados de esta sección porque, a 
diferencia de los teoremas, no están deducidos dentro de ninguna teoría de primer 
orden, sino en una meta teoría que tiene como objeto las propias Teorías de primer 
orden. Al ocuparnos de ellas desde fuera, obtendremos herramientas que nos 
permitirán abordar dichas teorías con más profundidad y eficacia. Los que aquí se 
van a obtener están encaminados a facilitar las demostraciones en teorías de primer 
orden que, sólo con los axiomas y reglas lógicas, pueden ser muy largas y dificiles. 
Más adelante estudiaremos otros resultados más tradicionalmente conocidos como 
tales meta teoremas y que se refieren a decidibilidad y completud. 


Nótese que no hay más forma de demostrar teoremas dentro de una teoría 
de primer orden que la dada en la Definición 3 de la sección anterior. Por otra parte 
la parquedad de los axiomas y reglas lógicos hace muy difícil la búsqueda de una 
demostración para un teorema concreto. El estudiante al que se le pida demostrar 
que 


VxA7>axA 
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es un teorema de cualquier teoría de primer orden, sin más armas que la definición 
de teorema en una teoría de primer orden, mostraría una muy razonable 
perplejidad. 


La economía patente en la definición de una teoría de primer orden la hace 
elegante y respetable, con tal de que se muestre suficientemente potente. No 
ocurriría lo mismo si, por comodidad, se diera en la propia definición una 
larguísima lista de axiomas y reglas con la excusa de facilitar el trabajo. Lo 
habitual es que esas ayudas se obtengan después en forma de reglas y teoremas 
derivados de los que habrá que demostrar en cada caso que cumplen su función: las 
reglas aplicadas a teoremas deben proporcionar teoremas y los teoremas derivados 
deben ser realmente tales teoremas. 


En contraposición a una casuística prolija e incómoda que se encuentra a 
veces, hemos querido que esta sección ofrezca una sola regla derivada de la que 
muchas son casos particulares y que, para otras que no lo son, facilita grandemente 
su demostración. Adelantando ideas, una formulación del teorema de tautología 
que vamos a exponer enseguida dice que las consecuencias tautológicas (concepto 
que se definirá) de teoremas son teoremas. Ésa es la regla a la que nos referimos y 
el papel que cumple el teorema de tautología subraya su gran importancia en el 
estudio moderno de la Lógica. 


No debemos finalizar esta introducción sin señalar que, además de las 
demostraciones según la Definición 3 de la sección anterior (conocidas como 
demostraciones al modo de Hilbert), hay otras muchas formas, y generalmente 
mucho más eficientes, de demostrar por medios indirectos que una fórmula A es 
teorema de T. De hecho, esas formas de demostración constituyen el contenido de 
la sección 1.2 y muchas de las posteriores. 


El teorema de tautología 


Una de las demostraciones del teorema de tautología procede a probarlo 
para la Lógica de proposiciones para luego extenderlo, no sin notable dificultad, a 
teorías de primer orden. Los conceptos de tautología y consecuencia tautológica 
que para la Lógica proposicional son semánticos (relacionados con el significado 
real, V o F, de las fórmulas, y no con su escritura) no tienen paralelo en la 
semántica de las teorías de primer orden que veremos en su momento. De ahí que 
haya que definir nuevos conceptos sintácticos para poder enunciar y demostrar el 
teorema de tautología para teorías de primer orden. Permitasenos insistir en que 
dicho teorema para teorías de primer orden así como los conceptos que involucra 
son sintácticos (simbólicos), puramente instrumentales y orientados a los meta 
teoremas a los que nos hemos referido. 
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Definición 1. Fórmulas elementales y valoraciones 


Decimos que una fórmula de un lenguaje de primer orden es elemental si 
es una fórmula atómica o una fórmula de la forma x B con B una fórmula 
cualquiera. Una valoración, v, es una aplicación de las fórmulas de un lenguaje de 
primer orden sobre el conjunto {V,F} que se define arbitrariamente para las 
fórmulas elementales y tal que 


v(=4) = F si y sólo si v(A) = V 
v(C VD) =F si y sólo si v(C) = v(D) = F 


Diremos algo más sobre las relaciones que hay entre las fórmulas 
elementales, las teorías de primer orden y la Lógica proposicional en la Nota 2 de 
15,23 


Nótese que, por la definición de fórmula y la definición de fórmula 
elemental, toda fórmula es elemental o de una de las dos formas =A y C v D, con 
lo que la valoración es una función total: toda fórmula tiene una valoración 
univocamente determinada. 


Definición 2. Consecuencia tautológica y tautología 


A es consecuencia tautológica del conjunto de fórmulas T si A es V en 
todas las valoraciones donde todas las fórmulas de I son V. Si A es V en toda 
valoración, se dice que A es una tautología. Naturalmente, la fórmula A es 
tautológicamente equivalente a B si cada una es consecuencia tautológica de la 
otra. 


Ejercicio 1. Demuéstrese que B, >B, > ... B, > A es una tautología si 
y sólo si A es consecuencia tautológica de B, B,, .. B, (debe usarse, 


demostrándolo previamente, que A es una tautología si es consecuencia tautológica 
del conjunto vacío). 


Ejercicio 2. Demuéstrese que cualquier axioma proposicional es una 
tautología y que las conclusiones de las reglas de expansión, contracción, 
asociativa y corte son consecuencias tautológicas de sus respectivas premisas. 
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Teorema 1. Teorema de tautología 


Primera versión. Para toda teoría de primer orden, T, si A ; A ey A, son 
j 


entonces B es 


teoremas de T y B es consecuencia tautológica de A s A PON A 4 


teorema de T. 
Segunda version. Si B es una tautologia, entonces T F B 


La demostración del teorema de tautología no es trivial y excede del 
alcance y propósito de este texto. Puede verse en (Shoenfield, 2001), (Srivastava, 
2008) o la curiosa demostración automática por medio del demostrador de Boyer- 
Moore de (Shankar, 1997). 


Permitasenos insistir en algo que, aunque claramente implícito, podría 
llevar a conclusiones erróneas en una primera lectura. Las tautologías son 
teoremas, pero hay muchos teoremas que no son tautologías puesto que lo que se 
ha establecido es una condición suficiente, pero no necesaria. Esto significa, entre 
otras cosas, que la utilización del teorema de tautología que vamos a hacer en las 
próximas páginas no nos exime de recurrir, en ocasiones, al axioma de sustitución 
(que no es una tautología) ni a la regla de introducción del cuantificador existencial 
(cuya conclusión no es consecuencia tautológica de la premisa). Véase, por 
ejemplo, la demostración de la regla de generalización en la demostración del 
Teorema 2 más abajo. 


Ejercicio 3. Demuéstrese la equivalencia de las dos versiones del teorema 
de tautología. 


Nota 1. Utilización de la consecuencia tautológica y las tautologías 


La regla derivada que anunciamos en la introducción a este tema no es sino 
la primera versión del teorema de tautología: “las consecuencias tautológicas de 
teoremas son teoremas”. El teorema de tautología permite añadir a una 
demostración cualquier fórmula que sea una tautología o una consecuencia 
tautológica de alguna o algunas de las anteriores fórmulas de la demostración; y la 
buena práctica consiste en señalarlo de esa forma (“B, la fórmula que se añade, es 
consecuencia tautológica de A, A,,...”). En lo que sigue se supondrá que, siempre 


que se invoque así la consecuencia tautológica (o la tautología), será porque se 
dispone de una prueba de ese hecho, esté escrita o no. Se escribirá expresamente 
cuando parezca oportuno, sea porque haya una demanda de dicha prueba, alguna 
duda sobre su existencia o cualquier otra razón. Véanse, por ejemplo, la 
demostración siguiente y la del Ejemplo 1. 
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Antes de entrar en aplicaciones más complejas, veamos cómo resultaría 
ahora la demostración del ejemplo 1 de la sección 1.1.2. 


Suponemos que A y A > B son axiomas de una teoría T. 


1.A>5B es teorema porque es axioma no lógico 
2. “Av B es el mismo teorema por definición de > 
3.A axioma no lógico 

4.BvA consecuencia tautológica de 3 

5.AvB consecuencia tautológica de 4 

6.BvB consecuencia tautológica de 5 y 2 

A consecuencia tautológica de 6. 


Como hemos dicho, en cada caso hay que probar que las consecuencias 
tautológicas efectivamente lo son. La demostración puede ser más o menos obvia, 
pero nunca entraña una dificultad grande. Tomemos por ejemplo la justificación de 
que B v B es consecuencia tautológica de A v B y —Av B, Para toda valoración 
v tal que v(A v B) = v(~Av B) = V, si ocurre que v(A) = V, v(~A) = F y, por tanto 
v(B) = V y v(B v B) = V; y, si ocurre que v(A) = F, v(B) = V y v(B v B) = V. Es 
decir, v(B v B) = V en todos los casos. 


Ya hemos señalado que podemos incluir una tautología en cualquier línea 
de una demostración debido a la segunda versión del teorema de tautología. Esto 
suscita la cuestión de cómo investigar si una fórmula es una tautología. Una forma 
de hacerlo se ilustra con el siguiente ejemplo particularmente sencillo y donde por 
un procedimiento elemental, en el que luego insistiremos, se concluye que una 
determinada fórmula es una tautología. 


Ejemplo 1. Una fórmula que es una tautología 


Sea la formula A —> B — A a B. Utilizando las definiciones de los 
símbolos derivados, la escribimos sólo con los símbolos —, v y 3: 


(0) A>B>AaB 

=Av -Bv (AaB) 

=Av -Bv (A > —B) 
(*) =Av -Bv (Av —B), 


pero la fórmula anterior es V en una valoración si y sólo si lo son las dos fórmulas 
siguientes 
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(1) Av Bv —A y 
(2) Av Bv ~B. 


En efecto, en una valoración cualquiera v, si (*) es V porque lo son =A o 
—B, es claro que (1) y (2) son V; si (*) es V porque v(= (~A v —B)) = V entonces 
v((=A v —B)) =F y v(~A) = v(~B) =F, con lo cual v(A) = v(~—B) = V y (1) 
y (2) son V. 


Recíprocamente, si (1) y (2) son V porque lo son ~A o —B, es claro que 
(*) es V y si (1) y (2) son V porque v(——A) = v(~—B) = V, entonces v(~A) = 
v(—B) =F, v((~A v —B)) =F y (~ (~A v —B)) = V con lo que (*) es V. 


Por otra parte, es inmediato que (1) y (2) son V en una valoración si y sólo 
si lo son las dos fórmulas siguientes 


(1). Av BvA y 
(2) Av -BVB 


Finalmente, sean cuales sean los valores v(A) y v(B), (1°) y (2”) son V 
porque o bien A es V o =A es V, en (1°), y también B es V o =B es V en (2’). Por 
tanto (1”) y (2”) son tautologías y, por la cadena de equivalencias que ha llevado 
hasta ellas, (0) también. 


Procedimiento para decidir si una fórmula es una tautología 


El ejemplo anterior presenta todas las técnicas, salvo una más que 
enseguida expondremos, para reducir una fórmula cualquiera a una disyunción de 
fórmulas elementales y negaciones de fórmulas elementales. El procedimiento se 
aplica tras reducir todos los símbolos a los tres símbolos primitivos, =, v y 3, y 
consiste en ir simplificando progresivamente las fórmulas usando las tres 
equivalencias tautológicas siguientes. 


e —~A v Des una tautología si y sólo si A v D lo es 
e (A v B) v F es una tautología si y sólo si A v B v F lo es (esta 
equivalencia no se ha usado en el ejemplo 1) 
e —(A vB) v Fes una tautologia si y sólo si lo son las fórmulas 
SAV F y Bv F. 


A y B son fórmulas y F una disyunción de fórmulas. 
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Ejercicio 4. Comprobaciones de tautologías 


Utilicese dicho procedimiento con algunas de las siguientes fórmulas y 
compruébese que en un número finito de pasos se obtiene una o varias 
disyunciones en las que aparece una fórmula y su negación con lo que tanto la 
fórmula final como la inicial son tautologías. Esto es así porque lo que sigue es una 
lista, obviamente no exhaustiva, de tautologías. Es claro que una fórmula que no es 
una tautología no será tautológicamente equivalente a una disyunción en la que 
aparezcan una fórmula y su negación. 


AAB>A AAB>B 
(ASB)>A>B (A > B) © (~B > -A) 
(A > B) > -B —> ~A (A > (B > C)) > (B > (A > C)) 
(A > B) > (B > C) > (A> ©) AvBoBvA 
(A > B) > A > (B > C) > (A > C) 

Av(BvC)e(AvB)vC AABACISOS(AAB)AC 
Av-AvC AGA 
Av(AaB) eA Aa(AvB) eA 
AM oA AOA 
A > (-B v B) (*) (=B~B)>A (*) 
=(AvB)o-A ~-B — (A a B) e —A v ~B 


(A > B) > ((A > C) > (A > B a C)) 
(B>A)> (C>A)>(BvC> A) 
(A > B) > ((A > -B) > A) 


(*) En general cualquier fórmula implica una fórmula siempre verdadera, 
una tautología; y una fórmula siempre falsa, la negación de una tautología, implica 
cualquier fórmula. 


Nota 2. Relación de las tautologías con las conectivas 


No debe extrañar que todas las fórmulas anteriores sean implicaciones o 
dobles implicaciones y que los cuantificadores no afloren a este nivel. En la línea 
de las ideas que estamos introduciendo, la simplificación de una fórmula termina 
en cuanto aparece un cuantificador como primer símbolo, porque si el cuantificador 
es existencial la fórmula ya es elemental y si es universal la fórmula es la negación 
de una fórmula elemental. Así pues nuestro interés en la búsqueda de tautologías 
está en la pericia en el tratamiento de las conectivas =, v , A, > y ©. Es más, de 
modo informal, pero con el trasfondo siempre seguro del sentido común, puede 
decirse que una fórmula es una tautología si la interpretación natural de sus 
conectivas lleva a concluir que debe ser verdadera: lo que las conectivas hacen 
“parecer” verdadero debe ser una tautología. 
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Ejercicio 5. Ejemplos de consecuencias tautológicas 


Como se vio en el Ejercicio 1, el hecho de que una implicación o doble 
implicación de dos fórmulas sea una tautología se reduce a que una es 
consecuencia tautológica de la otra, o viceversa, o ambas cosas. Dicho más 
explícitamente, si, por ejemplo, en la lista figura A A B > A como una tautologia, 
también figura implícitamente que A es consecuencia tautológica de A ^ B y lo 
mismo se puede decir de todas las demás implicaciones. Un buen ejercicio, por 
tanto, es demostrar que en las fórmulas de la anterior lista los consecuentes son 
consecuencia tautológica de los antecedentes. Así se obtiene una lista potencial- 
mente ilimitada de reglas derivadas. Por ejemplo, 


AB, ~B 
=A 


es la regla conocida como Modus Tollens y proviene de la tautología 


De la misma forma se obtienen: el contra recíproco de un teorema 


A>B_, 
=B > ~A 
las leyes de De Morgan 
=(AvB), =(AAB) 
aA A=B A v ~B 


y otras muchas bien conocidas y muy usadas, pero que gracias al teorema de 
tautología no es necesario memorizar. 


Ejercicio 6. Corrección y completud de la decisión sobre una tautología 


Los conceptos de corrección y completud aplicados a un procedimiento 
son similares a los de validez y completud en teorías de primer orden, véase 1.3 y 
1.4. Un procedimiento diseñado para la obtención de cierta respuesta es correcto 
si, cuando tetmina, su salida es la respuesta adecuada; y es completo si cuando la 
respuesta existe, la ejecución del procedimiento se detiene y la da como salida. 
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Demuéstrese que el procedimiento expuesto en el Ejercicio 4 es correcto y 
completo: si la fórmula de partida es una tautología, en un número finito de pasos, 
se llega a una fórmula de la forma ... vB v ...v —B v ... que es el modo en que el 
procedimiento termina con éxito porque ha demostrado que la fórmula dada es una 
tautología (completud) y, recíprocamente, si el procedimiento termina con éxito, la 
fórmula de partida es una tautología (corrección). La prueba de la corrección es 
inmediata puesto que en todos los pasos vamos de una fórmula a otra u otras 
tautológicamente equivalentes. Para la completud puede hacerse una inducción 
sobre las longitudes de las fórmulas que componen la dada, como lo fueron las 
fórmulas ~A, =B y 5 (~A v —B) para el ejemplo 1 donde se partía de la fórmula 
A — B —> A AB. Puede ser útil recordar, según apuntamos en la Definición 1 que, 
por la definición de fórmula elemental (atómicas y 3x B), una formula cualquiera 
no puede ser más que una fórmula elemental, la negación de una fórmula 
elemental, una doble negación, la negación de una disyunción o una disyunción. 


Ejercicio 7. Sobre la inconsistencia 


Demuéstrese que en una teoría de primer orden, T, se puede probar T H A 
yT H =A para cierta fórmula A si y sólo si para toda fórmula A de L(T) se puede 
probar T | A. 


Reglas y teoremas derivados 


Lo que sigue es un repertorio de algunas reglas y teoremas derivados 
obtenidos a partir del teorema de tautología y también muy cómodos y potentes en 
la demostración de teoremas. No se encuentran entre los de la sección anterior 
porque su demostración es menos inmediata y mecánica. Demostraremos aquellos 
que estimamos de mayor interés o dificultad y dejaremos las demás demostraciones 
como ejercicios de variada dificultad, no todas son triviales. Algunos ejemplos de 
aplicación se encuentran después de las demostraciones. Naturalmente, se pueden 
leer antes e incluso puede ser aconsejable hacerlo. Permítasenos insistir en que se 
trata de relaciones no exhaustivas que abren un camino por el que el lector puede 
continuar y que este caudal de resultados descansa en su totalidad sobre el teorema 
de tautología. 


Recordemos, Definiciones 5 de la sección 1.1.1, que una fórmula es 
cerrada cuando no tiene variables libres y definamos algunos nuevos conceptos que 
usaremos enseguida. 
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Definiciones 3. Instancias y cierres de fórmulas. Ampliación de teoría 


términos cualesquiera y x; son también variables cualesquiera, no necesariamente 
todas las variables de A, sustituibles por los correspondientes términos. 


El cierre de una fórmula A es la fórmula Vx, Vx> ... Vx, A, donde x,,X>,...,Xn 
son todas las variables libres de A en orden alfabético (véase la Definición 1 en 
1.1.1). Como es natural, el cierre de una fórmula cerrada es la propia fórmula. 


Si T[B, B, .. ] es una ampliación o aumento de la teoría T obtenida 
exclusivamente por adición de nuevos axiomas no lógicos B, B, .. a T, es 
inmediato que todo teorema de T lo es también de T[B,, B,, ... J. Lo que se pueda 


demostrar en T con sus axiomas y reglas, también se puede demostrar en cualquier 
ampliación de T pues contamos, por lo menos, con los mismos axiomas y reglas 
que en T. Es decir, la teoría ampliada tiene los mismos teoremas, o más, que la 
teoría sin ampliar. Esto es lo que se conoce como monotonía de la lógica clásica. 


Teorema 2. Reglas y teorema derivados 


Las siguientes reglas derivadas, salvo las de deducción y constantes, 
verifican que, si las premisas son teoremas de cierta teoría de primer orden T, la 
conclusión también lo es. Para las reglas de deducción y constantes la teoría no es 
la misma en los dos casos y se tiene que la premisa es teorema de una teoría que se 
especifica en la regla si y sólo si la conclusión lo es en otra teoría que también se 
especifica. El siguiente teorema derivado (de sustitución) es un teorema de 
cualquier teoría de primer orden T. 


Nótese que en algunas reglas (cierre, deducción, constantes) los papeles de 
premisa y conclusión son simétricos. Esto significa que la premisa es teorema si y 
sólo si lo es la conclusión y de esta forma se enuncia frecuentemente el 
correspondiente meta teorema. 


Regla de Introducción del cuantificador universal: 


A > B, x libre en A 
A>VxB 


Regla de Generalización: A 
VxA 
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Regla de Sustitución. Sea A’ una instancia de A: A 
A? 
Regla del Cierre, conocida también como Teorema del cierre. Sea A” el 
cierredeA: A_ y A? 
A? A 


Regla de la Deducción, conocida también como Teorema de la deducción. 
Sea A cerrada 


T[A kB TFA>B 


TLA>B T[A] } B 


Regla de Constantes. Sea T’ obtenida de T por la adición de constantes 
nuevas y distintas, pero no nuevos axiomas. Para toda fórmula A de T y todo 
conjunto de constantes nuevas y distintas {€1,€2,...,€n}, 


T La T E A(€j.€7:::-«Ep) 
T? F A(e¡,€2s....en) TFA 


Teorema de sustitución. Consta de dos afirmaciones: 


WTF Arealas aaaea A y 
(b) T E VxiV x2 ... V Xn A > Azt30,...x0[21:3250--,80] 


Demostración 


Las técnicas más usuales que pueden utilizarse para las demostraciones 
acerca de las reglas de introducción del cuantificador universal, sustitución y cierre 
(que son ejercicios) son el uso del contra recíproco, ~B > — A en lugar de A > B, 
la regla de introducción del cuantificador existencial y el axioma de sustitución 
tanto para una fórmula A como para una fórmula escrita como una negación — A. 
Para la parte de la regla de constantes en que de T” H A(€1,€2,....en) se deduce 
$ kA, basta cambiar las constantes €1,€2,...,€n por nuevas variables y,y2,...,yn en la 
demostración de A(e;,€»,...,€n) en T’ y observar que asi se tiene una demostración 
de A, con las nuevas variables, en T. Sustituir las nuevas variables por las variables 
de A es inmediato. . 


Demostración de la parte referente a la regla de generalización. 


Si T } A entonces T } Vx A 
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TT FA hipótesis 

2T PTA>=23xA consecuencia tautológica de 1(*) 

3T FIAXA>=23XA regla de introducción de 3 aplicada a 2 
4T p =__XA>=3IxA consecuencia tautológica de 3, 

5T F —~~3x A> YXA definición de V 

6T p IxA—>VxA consecuencia tautológica de 5 (**) 

7TF A> XA axioma 

8T F VxA consecuencia tautológica de 1,7 y 6. Se 


justifica de forma parecida a las anteriores 


(*) Aquí está la clave de la demostración: cualquier implicación de la forma 
=A > Hes consecuencia tautológica de A y podemos elegir H a nuestra 
conveniencia. El resto es rutina. Justificación: sea v tal que v(A)=V, 
entonces v(— A)=F y v(=A > —3xA)=V, por la definición de v para formulas 
no elementales. 

(**) Siempre que v(23x A >Vx A)=V y v(3x A)=V, será v(=3x A)=V, 
v(Vx A)=V y, por tanto, v(3x A >Vx A)=V. s 


Demostración de la parte referente a la regla (teorema) de la Deducción. 


Sea A cerrada. Se verifica T[A] F B si y sólo si T F A > B. Nótese que 
el teorema para varios axiomas, A;,A>, ..., cerrados se obtiene por una sencilla 
inducción. 


La primera parte T[A] F BsiT - A > B es consecuencia inmediata de 
las propiedades de una teoría ampliada. Veamos el recíproco: que la propiedad 
T -A>B se verifica para todos los teoremas B de T[A]. 


Recordemos (Ejercicio 2. de 1.1.3) que cualquier axioma proposicional es 
una tautología y que las conclusiones de las reglas de expansión, contracción, 
asociativa y corte son consecuencias tautológicas de sus respectivas premisas. Por 
tanto, podemos describir resumidamente todos los teoremas de una teoría como: 
sus axiomas, las consecuencias tautológicas de teoremas (eso incluye a las 
tautologías) y las conclusiones de la regla de introducción del cuantificador 
existencial aplicada a teoremas. En consecuencia, para demostrar la propiedad 
E Fa > B de todos los teoremas de T[A] haremos una inducción sobre esta 
descripción de los teoremas de T[A]. 


Paso básico. Si B es un axioma de T[A] puede ocurrir que 


BesA 
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entonces, T H A > A, por ser una tautología, y T H A=>B 


o bien B noes A 


entonces B será un axioma de T sin A, luego 
ITEB axioma 
20 H ASE consecuencia tautológica de 1 


Paso inductivo. 


(i) Si B es consecuencia tautológica de B, B, , ..., B_ , teoremas de T[A], 


1.T F AB, hipótesis de Inducción 
2.T | A B2 hipótesis de Inducción 
n. T } AB, hipótesis de Inducción 
n+1.T H A —> B consecuencia tautológica de 1, 2, ..., n 


(ii) Si B es X C > D, obtenida de C > D por aplicación de la regla de 
introducción del cuantificador existencial con x no libre en D 


1TFPFA>C>D hipótesis de Inducción 

2. TFC>A>SD consecuencia tautológica de 1 que puede 
escribirse como =Av=Cv D 

3.T | 3xC>A>D regla de introducción del cuantificador existencial 
aplicada a 2, x no libre en A (cerrada por hipótesis) ni D 

4. Tp A>3xC>0D consecuencia tautológica de 3, análogo a 2 
5.TFA>B definición de B D 


Ejercicio 8. Teorías con los cierres de los axiomas 


Sean T[A, B, ...] la teoría con axiomas no lógicos A, B, ... y T[A’, B’, ...] 
la teoría con los axiomas no lógicos A”, B”, ..., cierres de A, B, .... Demuéstrese 
que T[A, B, ...] y T[A’, B’, ...] tienen los mismos teoremas y, como consecuencia 
T[A, B, ...] es inconsistente si y sólo si T[A”, B”, ...] lo es. (Se trata de una 
aplicación inmediata de la regla del cierre.) 


Este ejercicio y otros resultados parecidos tienen frecuentes aplicaciones 
según las cuales en ciertos contextos es indiferente considerar T[A, B, ...] o T[A’, 
Be: 
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Ejemplo 2. Demostraciones con axiomas cuantificados existencialmente 


Se nos pide demostrar que T[3x B, Vx (B —-A)] F 3x A. Para ello, 
pensamos que sería bueno tener A(e), con e una constante, para finalizar con el 
axioma de sustitución A(e) > 4x A. A(e) a su vez se podría obtener del teorema de 
sustitución aplicado a Vx (B >A) y de la fórmula B(e) que parece una conclusión 
“natural” de 3xB, pero que, en todo lo que hemos visto, no se deduce de dicha 
fórmula xB. El siguiente procedimiento permite llevar a cabo rigurosamente el 
anterior proceso por medio de un rodeo en el que las reglas de deducción y 
constantes tienen un papel esencial. 


El objetivo es demostrar, para cierta fórmula G cerrada (4x A en nuestro 
ejemplo), que T[3x B, ...] F G (si G no es cerrada, se lleva a cabo todo el proceso 
con el cierre de G y, una vez finalizado, se deduce G de su cierre por la regla del 
mismo nombre). Llamemos T; a T[3x B, ...]. 


Paso I: se introduce una constante nueva, e, en Tı. Llamaremos Tie a esta 
nueva teoría. 


Paso 2: se amplía Tie con un nuevo axioma no lógico B(e), T2 := T, ¿[B(e)]. 
Nótese que a partir de aquí sí se puede usar el axioma B(e) 


Paso 3: se deduce T, |— G. En el ejemplo 


B(e) axioma 

Vx(B>A) axioma 

Vx (B >A) > (B(e) >A(e)) teorema de sustitución 

B(e) >A(e) modus ponens, consecuencia tautológica de 2 y 3 
A(e) modus ponens 1 y 4 

; A(e) >3x A axioma de sustitución 

. Tie[B(e)] } 3x A modus ponens 5 y 6 


N 
a A des sl 


Paso 4: se aplica la regla de deducción para obtener Tie — B(e) > G. 
8. Tis F B(e) > ax A regla deducción 7 
Paso 5: se aplica la regla de constantes para obtener T; H B(x) > G. 


9.7; H B(x) >3x A regla de constantes 
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Paso 6: se aplica la regla de introducción del cuantificador existencial para 
obtener Tı | 3x B(x) > G. 


10. T; H dx B(x) > ax A r. introd. cuantificador existencial 


Paso 7: como T; F 3x B(x) (axioma no lógico), por modus ponens se 
obtiene T; H G que era nuestro objetivo. 


TRN H 3x B(x) axioma 
12.T, + 3xA modus ponens. 


Ejercicio 9. Demuéstrese, utilizando el procedimiento del ejemplo 
anterior, que T[Ax(B(X) A AGO), Vy(Ax B(x) A(y))] F Vx A(x). (Este ejercicio 
justifica la eficiencia de los pasos 1 a 7 que en el citado ejemplo podrían obviarse 
por su intencionada sencillez.) 


Reducción al absurdo o inconsistencia al negar un teorema 


El teorema que sigue tiene una especial importancia en varios aspectos. Se 
utiliza para demostrar el teorema de completud aunque en este texto no vamos a 
entrar en ese detalle. Además, es la base de cualquier demostración por reducción 
al absurdo que acostumbramos hacer de forma casi automática y sin cuestionarnos 
qué es lo que la hace correcta. Finalmente, tanto el teorema que aquí veremos como 
su versión semántica que se demuestra con gran sencillez en la sección 1.3.3, 
Teorema 1, se utilizan en gran parte de los cálculos y métodos de demostración que 
vamos a ver. De hecho y como comentamos más arriba, la dificultad de generar de 
forma efectiva demostraciones en una teoría de primer orden hace que, en la 
práctica, se busque demostrar una inconsistencia o una insatisfacibilidad que, como 
luego veremos, son equivalentes. 


Teorema 3. Demostración por reducción al absurdo 


Sea A una fórmula del lenguaje, L(T), de una teoría T y sea A’ el cierre de 
A. A es un teorema de T si y sólo si T[~A’] es inconsistente. 


Demostración. Supongamos primero que A es un teorema de T 


‘tebe A hipótesis 

2. TA] F A ampliación de la teoría 
3. TRA] FP A’ regla del cierre 2 

3. TRA] F -2' axioma 
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hemos llegado a los dos teoremas A’ y ~A’ en T[~A’], luego es inconsistente. Si 
suponemos ahora que T[—A”] es inconsistente, cualquier fórmula es teorema en esa 
teoría 


1. T[-A1] H A’ A-A’ inconsistencia 

2.T FAA’ > A’ AAA’ regla de deducción 1 

3.T F ~A v (A A 7A) definición de la implicación 2 

4.T F ~A consecuencia tautológica de 3 (A'^ ~A’) es 
F en toda valoración 

STHA consecuencia tautológica de 4 

6.T f A regla del cierre 5. G 


1.2 EL CÁLCULO DE TABLAS ANALÍTICAS 


Un cálculo (lógico) es una colección de reglas mecánicas que permiten 
hacer progresar las deducciones en un sistema formal. “Mecánicas” no se refiere 
obviamente a máquinas fisicas sino al carácter elemental, comprensible y 
ejecutable de tales reglas. Frecuentemente estos cálculos pueden ser fácilmente 
descritos por algoritmos y, en consecuencia, son claros candidatos para una 
implementación computacional. Algunos de ellos surgen del estudio de la teoría de 
Herbrand, como veremos en su lugar; y el método de resolución, que también 
expondremos en los dos siguientes capítulos, es un ejemplo singular tanto por su 
potencia como teoría lógica como por su implementación en PROLOG de 
indiscutible importancia. 


El cálculo que aquí vamos a exponer se ajusta a la descripción que 
acabamos de hacer y, de hecho, es una pequeña variación sobre el método de los 
tableaux que, en el campo de la demostración automática, han recogido el testigo 
del cálculo de secuentes de Gentzen (Gentzen, 1935) (véase la Nota 2 de 2.4). En 
esta sección exponemos el cálculo en términos lógicos y en el Apéndice B 
hablamos de la corrección y completud que son las propiedades que avalan su uso 
como un procedimiento de razonamiento automático. 


Sea T el conjunto formado por los axiomas no lógicos de una teoría T junto 
con la negación del cierre de una fórmula que es candidata a teorema de esa teoría, 
una posible conclusión. Se trata de demostrar que la conclusión es, efectivamente, 
un teorema de T. Hasta este momento no disponiamos de más forma de llevar a 
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cabo esa tarea que encadenar un numero finito de aplicaciones de reglas a axiomas 
o teoremas previos. Una alternativa a este procedimiento es la comprobación de 
que T[T] es inconsistente o, como más adelante veremos, insatisfacible, puesto que 
tal inconsistencia es equivalente a que la conclusión es un teorema de T (Teorema 
de reducción al absurdo, Teorema 3 de la Sección anterior 1.1.3). Como hemos 
dicho más arriba esta equivalencia es la base de muchos demostradores y del 
sistema de resolución que estudiaremos en el próximo capítulo. 


Las Tablas analíticas realizan dicha comprobación construyendo un árbol 
que, cuando demuestra la inconsistencia de I, recibe el nombre de refutación. En la 
raíz, el nodo inicial, se colocan las fórmulas de I. El resto del árbol se obtiene 
expandiéndolo por aplicación de las reglas que se definen a continuación. El 


procedimiento de utilización del método es el contenido de la Nota 3 de la sección 
1232, 


1.2.1 Definiciones y utilización 


Definición 1. Tablas analíticas 


Una tabla analítica es un conjunto de elementos, llamados nodos, que está 
parcialmente ordenado y clasificado en niveles como se explica más abajo. 
(Cuando no se preste a confusión, nos referiremos a una tabla analítica 
simplemente con el término tabla.) Con cada nodo se asocia un conjunto finito de 
formulas, su etiqueta. Habitualmente, identificaremos cada nodo con su etiqueta, 
salvo en los casos que se presten a confusión. Es útil visualizar una tabla analítica 
como un árbol invertido. 


Cada nodo pertenece a un único nivel que se designa por un número 
natural. Hay un solo nodo de nivel 0: el nodo inicial de la tabla. Cada nodo de 
nivel n+1 es el sucesor de un único nodo que debe ser de nivel n, y se obtiene por 
aplicación de alguna de las reglas que enunciamos más abajo a dicho nodo de 
nivel n. (En la representación en forma de árbol, los sucesores de un nodo se ponen 
debajo del mismo y se unen a él mediante segmentos.) Un nodo es terminal si no 
tiene sucesores. 


Si una tabla tiene al menos un nodo de nivel p y ninguno de mayor nivel, se 
dice que p es la profundidad de la tabla. 


Una rama de una tabla es una sucesión finita de nodos T, ..., I), tales que 


° a es el nodo inicial de la tabla; 
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e paraizl,..., k, T, es un sucesor de T ; y 
e J, es terminal. 
Se dice que la rama termina en T>. Para cada nodo terminal hay una rama 
que termina en él. 


Una tabla con nodo inicial I), se dice que es una tabla para T, 


Los nodos de una tabla analitica estan parcialmente ordenados por la 
relación de siguiente: cada nodo es seguido por sus propios sucesores, los 
sucesores de estos, etc. 


Definición 2. Tablas analíticas de primer orden (definición inductiva) 


(i) Si I, es un conjunto finito de fórmulas de una teoría de primer orden, la 
tabla analítica cuyo único nodo es I), es una tabla analítica de primer orden 
para I), 

(ii) Si T es una tabla analítica de primer orden para I), la tabla T’ obtenida 


de T por aplicación de alguna de las reglas (a) o (b) que siguen es una tabla 
analítica de primer orden para I), 


(iti) Sólo son tablas analíticas de primer orden las definidas por (i) y (ii). 
Reglas 


(a) Reglas de conectivas TA 


A>B (A>B) AaB (AAB) AvB (AWB) 
-A |B A, -B AB -A|-B AÍB  >A,>B 


(b) Reglas de cuantificadores 


Vx P = VxP 3x P Sx P 
Pt Pe Pe Pt 
(t: término) (e nueva) (e nueva) (t: término) 


Nota 1. Sobre notación 


Una regla con la sintaxis 
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P 


Q, (05 


debe entenderse como una abreviatura de lo siguiente. “Si entre las fórmulas de una 
rama de T que termina en el nodo I hay una fórmula de la forma P, añádase un 
nuevo nodo {Q, (Q’)} como sucesor de I”. La fórmula Q’ va entre paréntesis para 
indicar que el nuevo nodo unas veces consta de una sola fórmula, {Q}, y otras de 


dos, {Q, Q’}. 


Una regla con la sintaxis 
me Pee 
Q, 1 Q, 


debe entenderse como una abreviatura de lo siguiente. “Si entre las formulas de una 
rama de T que termina en el nodo T hay una fórmula de la forma P, añádanse dos 
nuevos nodos, (Q1) {Q2}, como sucesores de I”. El símbolo | marca el principio 
de una ramificación en la que las dos nuevas ramas comienzan por las fórmulas que 
están, respectivamente, a la izquierda y la derecha de 


Pt, Pe son abreviaturas de P,[t], P,[e], respectivamente, con e constante. t 
es un término cualquiera. Que e es nueva quiere decir que la constante e no está en 
el lenguaje utilizado en las fórmulas de la rama que estamos extendiendo. 


Definición 3. Refutación 


Una rama de una tabla analítica está cerrada cuando contiene una fórmula 
atómica y su negación. Se demuestra que una rama puede cerrarse si contiene una 
fórmula cualquiera (atómica o no) y su negación y, en la práctica, consideraremos 
que, en ese caso, la rama está cerrada. Cuando todas las ramas de una tabla para IT 
están cerradas se dice que la tabla es una refutación de T. 


Ejemplo 1. 


Sea una tabla para T = {~ [C A > B)>((FA>>”B)> A)]).T es el 
nodo inicial, de nivel cero. Le sigue el nodo {~ A > B, ~ (© A > -~ B) > A)) 


que en esta tabla es el único de nivel uno. Los demás nodos son {= A > ~ B, ~A}, 
de nivel dos, {~~ A } y { B }, de nivel tres y {A } y {~ B }, de nivel cuatro. La 
tabla tiene profundidad cuatro porque los últimos nodos son de nivel cuatro. 
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=[(PA> B)>o(PA>>-B)>A) 


-A > B,- (CA >-B)>A) 


1 | 
Y —A =B Y 


Las reglas utilizadas para añadir, respectivamente, los nodos de nivel uno, 
dos, tres y cuatro han sido 


=> con-[(AA—> B)>(6A>-=B)>A), 
=> con-((-A>-=B)> A), 
> con=A > B, e 
> con=A>-=B, 
por este mismo orden. 


El símbolo Y marca el punto donde una rama se ha cerrado. 


Esta tabla es una refutación de ~ [(- A > B) > (C A > ~ B) > A). Como 
veremos, eso demuestra que Tí? [C A > B) > (C A > ` B) > A)] es 
inconsistente y, por lo tanto, (~ A —> B) > (© A > ~B) > A) es un teorema de T. 


Ejemplo 2 


Vamos a construir una tabla analítica para el conjunto {Vx(P(x) > Q(x)), 
3x>Q(3), Vx (P(x) v A(x)), 7SxA(x)}, que en la representación gráfica ocupa 
cuatro líneas, pero es efectivamente un solo nodo. Las reglas utilizadas han sido 

con ax QU): 

con Vx (P(x) > Q(x)), 

Y con Vx (P(x) v A(x)), 
3° con Sax A(x); 
— con P(r) > Q(r), y 


v con P(s) v A(s), por este mismo orden. El símbolo Y marca el punto donde 
una rama se ha cerrado. 
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Vx (P(x) > Q(x), 
Ax > Q(x), 

Vx (P(x) v A(x)), 
73x A(x) 
> Qe) 


P(r) y Qe) rie 


P(s) v A(s) se 
~A te 


gees E 
ETA 


Y P(s) A(s) Y 


Esta tabla es una refutación del nodo inicial. Como veremos en el Teorema 
1 de la sección siguiente 1.2.2, eso demuestra que la teoría cuyos axiomas no 
lógicos son las fórmulas de dicho nodo inicial es inconsistente y, por lo tanto, 
xA(x) es un teorema en la teoría con axiomas no lógicos Vx (P(x) > Q(x)), 
3x-Q69, Vx (P(x) v A(x)). 


Los términos r, s, t deben especificarse en el punto en que aparecen al 
aplicar las reglas de que se trate; en este caso se han usado dos reglas V y la regla 
~J y se han especificado todos los términos como e’s. Sin embargo, la elección del 
término concreto con el que se van a especificar puede retrasarse provisionalmente 
hasta el momento en que se va a cerrar cada rama. En este caso, hay que cuidar de 
que en la tabla definitiva no se viole la restricción de que las constantes que 
aparecen en la aplicación de las reglas 3 o ~V han de ser nuevas. 


Ejemplo 3. Uso incorrecto de las tablas analíticas 


Como ilustración de la última observación tenemos la tabla para {Vx 3y 
A(x,y), -3y Vx A(x,y)}, en la que se han aplicado sucesivamente las reglas V y 3 a 
Vx dy A(x,y) y las reglas 73 y ~Y a 73y Vx A(x,y), pero en forma incorrecta. 


En efecto, la constante supuestamente nueva, e”, introducida en el nivel 4, 
= A(e’,s), no es realmente nueva porque esta en la fórmula del nivel 1, Sy A(r,y) 
con r:e”, que es anterior. 
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Vx dy A(%y), 


-3y Vx Ay) 


dy Alr.y) ne 
A(rk) 
Vx A[x,s) sie 
> A(e’,s) 


1.2.2 Aplicación 


Teorema 1. Correccién y completud de las tablas analiticas 


Para todo conjunto finito de fórmulas cerradas, T, I puede ser refutado si 
y sólo si T[T]_ la teoría cuyos axiomas no lógicos son las formulas de I es 
inconsistente. 


Este teorema es el contenido del Apéndice B. 
Corolario 1. Aplicación a la demostración 


Si hay una refutación del conjunto { B’ , B”,,..., B’, 7 A’} (donde A’ es el 
cierre de cierta fórmula A y B iy B 3 co A fórmulas cerradas), entonces Á es un 
teorema de la teoría cuyos axiomas no lógicos son B”, B”,,..., B’; m 


Demostración. Es una consecuencia inmediata del teorema anterior y el 
teorema de reducción al absurdo, Teorema 3 de 1.1.3. 


Corolario 2. Posibilidad de cerrar los axiomas 


Si hay una refutación del conjunto { B’ , B”,,..., B’, 7 A`}, donde A’ es el 
cierre de cierta fórmula A y las fórmulas B’, B’,, ..., B’, son el resultado de 
cerrar las fórmulas de { B,, B,, ..., B, ), entonces A es un teorema de la teoría 
cuyos axiomas no lógicos son B, B,, ... B; 
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Demostración. La existencia de una refutación del conjunto { B’,, B’,, ..., 


B’ » 7 A”] demuestra que T[B”,, B”,, ..., B”,] ha, por el corolario anterior. Pero 
T[B,, B,, ... B,] Ha si y sólo si T[B’,, B’,, ..., B^] FA. (Ejercicio 8 de 1.1.3.). 
Por tanto, se tiene el resultado buscado. C] 


Nota 1. La utilización del conjunto { Bo B’, es Be en lugar de { B, 
B,, ... B,) (donde las fórmulas B’, B’, , ..., B’, son el resultado de cerrar las 
formulas de ( B, B,, ... B_)) no quita generalidad al estudio del problema T[B, B,, 
Br] H A. Esto es asi porque si hay una refutación para { B,, B,, ... Bp ~A’}, 
también la hay, en general otra, para el conjunto { B’ |, B’,, .... B’ p = A”) (véase la 
demostración a continuación) y, según el Corolario 2, eso demuestra que T[B,, B,, 
BY] FA. 


En efecto, supongamos que hay una refutación para {B,, B,, ... Bp ~A’}. 
Construyamos una tabla con raíz {B’ |, B’, ,..., B’ p 2 A”). Si aplicamos un número 
finito de veces la regla V a las fórmulas B,’, B,', ... B; resultado de cerrar las 
fórmulas, no cerradas, By B,, des B, de T, obtendremos un número finito, p, de 
nodos sucesores inmediatos de I’ entre los cuales estarán las fórmulas Bo B,, ai 
B.. Eso significa que la refutación que se obtuvo para {B , B,, ... B,, > A”) se 


puede repetir aquí: si era de profundidad cero (es decir, no constaba más que de la 
raíz), ya la tenemos, puesto que Be B> ES Bo = A”) está en esta tabla de 


profundidad p; si no, basta repetir, a partir de los nodos de nivel p+1, los pasos que 
condujeron a la refutación de (B,, B,, ... B,, — A”). De esta forma tenemos una 


refutación para (B” ,B”_,..., B? , A”), como queríamos demostrar. C 
p 1 2 n 


Nota 2. Por otra parte, si T[B,, B,, ... B,] La, TIB” p B”, + <<» B’ LA, 
como hemos recordado en la demostración del Corolario 2 y, por el teorema de 


reducción al absurdo, Teorema 3 de 1.1.3, y el Teorema 1, hay una refutación de 
BSAS. 


Nota 3. Aplicación de las tablas analíticas al problema de la 
demostración de un teorema 


Para demostrar que Á es un teorema de la teoría cuyos axiomas no lógicos 
son B, B, ... B,, búsquese una refutación de { B’, B’,, ..., B’,, 7 A') (donde A’ es 
el cierre de A y las formulas B’, B’,, ..., B’, son el resultado de cerrar las 
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fórmulas de { B, B, ... B,)) y, si se obtiene dicha refutación, concliyase que 
efectivamente T[B,, B, ... B,] |\—A. 


La corrección y completud de este procedimiento está justificada por las 
dos notas anteriores. 


1.3 SEMÁNTICA 


El objeto de esta sección es proporcionar las herramientas (estructuras) que 
permitan asociar significados a los símbolos de cualquier lenguaje de primer orden 
L. En particular, hay que asociar funciones a los símbolos de función y predicados 
a los símbolos de predicado. Una asociación así definida se conoce como una 
semántica de L. Esta distinción entre semántica, significado, y sintaxis, las 
expresiones de L, es fundamental. Toda expresión de L es puramente simbólica y 
no tiene ningún significado por sí misma, sólo lo tiene si se le asocia en una 
estructura definida para L. Por otra parte, los individuos, los predicados y los 
valores de verdad o falsedad que definiremos en cualquier estructura, se 
conceptualizan como realidades que pueden simbolizarse con expresiones de L o 
de cualquier otro lenguaje. 


Por ejemplo, que el cero es el neutro de la suma (una realidad en el mundo 
de la aritmética) se puede simbolizar con cualquiera de las fórmulas 


Vx(x+0=x) 6 Vu(u*e=u) 
que están escritas en distintos lenguajes. Sin embargo, también ocurre que 
diferentes estructuras dan distintos significados a esas mismas fórmulas como, por 
ejemplo, “en la vida de cualquier hombre (‘u’) el mucho cavilar (‘e’) no añade (**”) 
nada (‘= w)”. 


Para lo que sigue, conviene recordar estas tres definiciones. 


Se llama n-tupla o tupla (si no hay confusión) de un conjunto A a una 
sucesión (a, a, ... a) de elementos de A. 


Una función n-aria de A en B es una aplicación de las n-tuplas de A en B. 


Un predicado n-ario en A es un subconjunto, P, de las n-tuplas de A. (En 
otras definiciones P sería el conjunto de tuplas que hacen verdadero al predicado.) 
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Nota 1. Funciones y predicados 0-arios 


Para n=0 convendremos en que sólo hay una 0-tupla ( ) e identificaremos 
cada función 0-aria, aplicación de ( ) en B, con su imagen: un solo elemento de B, 
un individuo. Llamaremos predicado 0-ario a cualquiera de las letras V o F puesto 
que sólo hay dos conjuntos de 0-tuplas {()} y el vacío. 


1.3.1 Estructuras 


Definición 1. Estructuras 


Una estructura M para un lenguaje de primer orden L se define como una 
terna M = (|M], F, P ) donde |M], un conjunto no vacío, se dice que es el universo 
de M, y F y P son conjuntos de funciones y predicados definidos en |M]. Algunos 
de los elementos de F y P serán la interpretación de los símbolos de los conjuntos 
Fj y Pj que especifican L; y para que se pueda afirmar correctamente que la 
estructura M es precisamente para el lenguaje L se debe tener, por definición, en F 
y P un elemento, fy o pm, por cada elemento, f o p, de los conjuntos F; y P; y la 
aridad de fu y puha de ser la misma que fy p tienen en L. 


Nota 1. Estructuras para lenguajes con igualdad 


Cuando L incluya el símbolo de predicado binario =, siempre se le asocia 
en M el predicado identidad ordinaria en |M]. 


Ejemplo 1. Comprobación de la verdad y falsedad 


Dada la fórmula Vx (H(x) > O(x)) (todos los hombres son mortales) 
donde H y O son símbolos de predicado unoario, podemos definir una estructura 
para el lenguaje en que está escrita de la siguiente forma: |M| = {seres vivos en 
Madrid}, Hm = [seres humanos en Madrid}, Om = [seres mortales en Madrid}. La 
fórmula es claramente verdadera en M como enseguida definiremos, pero debe ser 
igualmente claro que en otra estructura puede ser falsa. Si por ejemplo suponemos 
que hay superhéroes humanos e inmortales en Madrid, la nueva estructura tendrá 
como universo el que resulta de esta nueva hipótesis (seres vivos en Madrid, entre 
los que hay superhéroes humanos e inmortales), Hy y Om mantienen sus 
definiciones y no todo humano, H, es mortal, O. La fórmula es falsa en la nueva 
estructura. 


Por otra parte no podemos hablar de significado de H(x) en M si no damos 
un significado a x en M. H(x) no parece que pueda ser verdadero o falso si no 
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“sabemos” qué es x. Si damos a x como significado en M por ejemplo la 
persona David (que suponemos un ser humano) entonces, para ese significado de 
x, H(x) es verdadera en M porque simboliza exactamente lo que entendemos 
realmente por la propiedad de ser humano. H(x) sería falsa en M si damos a x 
como significado en M el osito_Bingxing, que no es un ser humano. 


Como esta forma de argumentar es larga y un tanto oscura, vamos a 
permitirnos escribir que H(i,) es V en M y H(i) es F en M, entendiendo, como 
enseguida definiremos con precisión, que i; e iz son constantes de L, los llamados 
nombres de, respectivamente, la persona David y el osito Bingxing. Es muy 
importante entender que no es correcto escribir H(persona_David), ni pensar que 
estamos escribiendo una fórmula de L, porque persona_David está en M, no en L, 
mientras que el símbolo H está en L, pero no en M; y L, sintaxis, y M, semántica, 
son dos mundos paralelos, pero separados. Todo esto justifica la siguiente 
definición de lenguaje ampliado. 


Definición 2. Lenguaje ampliado. Nombres 


Dada una estructura M para un lenguaje L, definimos el lenguaje ampliado 
L(M) como el obtenido al añadir a L un conjunto de símbolos nuevos que llamamos 
los nombres de los individuos de M y cada uno de cuyos elementos verifica que es 
una constante nueva y distinta asociada a cada uno de los individuos de M. En el 
ejemplo anterior podemos considerar que i; es la constante de L “nombre de 
persona_David” e i, la constante de L “nombre de osito_Bing-xing”. 


1.3.2 Significado de expresiones 


Definición 1. Significado de términos sin variables 


Para los términos sin variables del lenguaje, su significado en M es un 
individuo de M definido inductivamente asi: 


e si a es un nombre, M(a) es el individuo cuyo nombre es a 
ssiaesfaa,..a, Ma) es f, (Mía), Ma), .... M(a)). 
Definición 2. Significado de fórmulas cerradas 


Análogamente, el significado en M de una fórmula cerrada es V o F según 
la siguiente definición: 
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(a) si A es atómica, pa a, ... a, M(A) es p (Mía), Mía), .... M(a,)) 

(b) si A es =B, M(A) es V si y sólo si M(B) es F 

(c) si A es B VC, M(A) es F si y sólo si M(B) y M(C) son F 

(d) si A es X B, M(A) es V si y sólo si M(B, [i]) es V para algún nombre, i, 
de L(M) 


Nótese que de esta forma hemos dado significado a toda fórmula cerrada 
pues hemos cubierto todos los casos contemplados en la Definición 3 de 1.1.1. Sin 
embargo, como se dijo en la Definición 4 de la misma sección, vamos a construir 
fórmulas utilizando otras conectivas derivadas y, dado que todas están definidas en 
términos de las usadas en (b), (c) y (d), no es difícil demostrar que los significados 
son los que se resumen en (e) y la tabla (f). 


(e) si A es Vx B, M(Vx B) = V si y sólo si M(B [i]) es V para todo nombre, 
i, de L(M) 


() MB) MC M(B >C) M(B aC) MB &C) 
V We V V V 
V E F F. F 
P V 4 k F 
E F v F Vv 


Como ya hicimos notar en el Ejemplo 1 de la sección anterior con la 
sencilla fórmula H(x), no podemos pretender que una fórmula que no sea cerrada 
sea verdadera, o falsa, en una estructura M, pero sí podemos distinguir, dicho de 
modo informal, entre que todos sus ejemplos sean verdaderos o no. Puede 
entenderse que H(x) significa una afirmación genérica, si x está libre, mientras que, 
para i el nombre de un individuo de M, H(i) significa el ejemplo de esa afirmación 
atribuida al “dueño” del nombre i. De esta forma se puede dar significado a una 
fórmula cualquiera en una estructura M 


Definición 3. M-instancias de fórmulas 


Una M-instancia de A es una fórmula cerrada, de L(M), de la forma Ax x, 
1 lt ES say Lf con i nombres de L(M). Nótese que las M-instancias de una 
fórmula cerrada coinciden con la propia fórmula puesto que no tiene variables 
libres. 
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Definición 4. Validez en una estructura 


Una fórmula A de un lenguaje L es válida en una estructura M para L si 
todas sus M-instancias son V en M. 


Ejemplo 1. Semántica de la Aritmética formal 


Para el lenguaje definido en el Ejemplo 2 de 1.1.1 podemos definir una 
estructura M = < |M], F, P > con 


(a) |M| = N, los números naturales (incluyendo el cero) que escribiremos en 
negrita para distinguirlos de los símbolos de L, 


(b) F y P las funciones y predicados que se definen a continuación 


» a la constante 0 asociamos el número 0 
e al símbolo de función s le asociamos la función sucesor, s 
e al símbolo de función binaria + le asociamos la operación real de sumar + y 
e al símbolo de predicado binario < le asociamos el predicado < “es menor 
que” 
Recuérdese que, como siempre que está presente, al símbolo de predicado 
binario = se le asocia la identidad ordinaria en |M]. 


Definimos una infinidad de constantes nuevas (i;, j=0, 1, ...}, los nombres 
de los individuos de M (en este caso, entenderemos que i; es el nombre del número 
j) y con estos nombres definimos el lenguaje ampliado como L(M) =L U {i,j = 
O 


Significado de términos sin variables 


e M(io) es 0 porque ip es el nombre de 0. 

e M(0) es 0 porque 0 es la función 0-aria, el individuo en este caso, asociada 
por la definición al símbolo de función 0-aria 0, una constante en este caso. 
e M(+s00), o bien M(s(0)+0), es M(s0)+M(0), porque + es la función 2-aria, 
+m, asociada por la definición al símbolo de función 2-aria +; a su vez 
M(s0)+M(0) es s(0)+0 es decir 1+0: el número 1, porque s es la función 1- 
aria, sm (sumar 1), asociada por la definición al símbolo de función 1-aria s. 


Significado de fórmulas 


e M(<0s0), o bien M(0<s(0)), es V en M porque M(0), que es 0 como 
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hemos visto antes, es menor que M(s(0)), que también hemos visto 
que es 1, es decir 0< m 1,00<1 
e M(x =xsy), o bien M(x (x = s(y))) es válida en M. 


Demostremos esta última afirmación. Una M-instancia arbitraria de 3x (x = 
s(y)) es 3x (x = s(ij)). A su vez M(x (x = s(i;))) es V en M porque el significado de 
x = s(i;) con el nombre i;+, en el lugar de x, M (ij. = s(i;)), es V en M (véase el 
siguiente párrafo) y esto es lo que dice la definición de que la fórmula cerrada, 
xB, es V en M. 


La justificación de que M (ij+ı = s(ij)) es V en M es la siguiente: M(i;+1) que 
es j+1, es idéntico a M(s(i;) que es su(M(i;)), o bien s(j), o sea j+1. 


Finalmente, si, como hemos demostrado, cualquier M-instancia de 3x (x = 
s(y)) es V en M, 3x (x = s(y)) es válida en M por definición. Nótese que no tiene 
sentido preguntarse si M(3x (x = s(y))) es V o F en M porque Sx (x = s(y)) no es 
una fórmula cerrada, la variable y está libre en la fórmula. 


1.3.3 Validez 


Definiciones 1. Validez, consecuencia, modelos, satisfacibilidad, 
contraejemplos 


Decimos que una fórmula A, de un lenguaje de primer orden L, es válida si 
es válida en toda estructura M para L. La expresión lógicamente válida es 
sinónima de válida. 


Sea { B „ B, ...} un conjunto de formulas de L, decimos que la fórmula A de 


L es consecuencia lógica de dicho conjunto si para toda estructura M tal que 
todas las B, son válidas en M, A es válida en M. 


Un modelo M de una teoría T es aquella estructura donde los axiomas no 
lógicos de T son válidos. 


Por tanto, la comprobación de que M es un modelo de T requiere probar 
exclusivamente que los axiomas no lógicos son válidos en M, aunque, de hecho, 
también los axiomas lógicos sean válidos en cualquier modelo (y en cualquier 
estructura, como demostraremos en el teorema de validez, Teorema 2 a 
continuación). 
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Una teoría es satisfacible si tiene modelos e insatisfacible en caso 
contrario. Muy frecuentemente, y si no hay riesgo de confusión, estos adjetivos se 
aplican al conjunto de los axiomas no lógicos de la teoría como conjunto de 
fórmulas sin relación explícita con una teoría. Así, puede decirse que una fórmula 
o un conjunto de fórmulas es o no satisfacible y que tiene o no modelos. 


Se dice que una fórmula A es válida en la teoría T y se escribe 
abreviadamente T | A, si A es válida en todos los modelos de T. 


Una estructura M para el lenguaje L(T) de una teoría de primer orden T es 
un contraejemplo para la fórmula A de L(T) si 


* Mes un modelo de T 
+ Ano es válida en T. 


Nota 1. Sobre contraejemplos 


Como veremos en el Teorema de validez a continuación, la fórmula A que 
no es válida en T tampoco es teorema de T y de ahí la utilidad de la construcción 
de contraejemplos. Tan importante es saber que una fórmula es teorema como 
saber que no lo es y si tenemos un contraejemplo para A de L(T), hemos 
demostrado que A no es teorema de T. Véase el Ejemplo 3 de la Sección siguiente. 


Ejercicio 1. Demuéstrese que el cierre de una fórmula A es válido en una 
estructura M si y sólo si A es válida en M. (Basta observar que la definición de 
validez en M de una fórmula no cerrada lleva a la de Verdad en M de su cierre). 


Teorema 1. Condición de fórmula válida en una teoría 


Sea A una fórmula del lenguaje, L(T), de una teoría T y sea A’ el cierre de 
A. A es válida en T si y sólo si T[-A’] es insatisfacible (no tiene modelos). 


Nótese que ésta es la versión semántica del Teorema 3 de 1.1.3 y que, 
como allí apuntamos es la base teórica de importantes métodos de demostración y 
en particular de la utilización de la resolución. 


Demostración 


Que A es válida en T equivale, por definición, a su validez en todos los 
modelos de T. La validez de A en todos los modelos de T equivale a la validez, y 
valor V, de su cierre A’ en todos los modelos de T. (Ejercicio 1) A’ es V en todos 
los modelos de T es equivalente a que ~A’ es F en los mismos. Que ~A’ es F en 
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todos los modelos de T es equivalente a que T[-A’] no tiene modelos, porque, si 
los tuviera, ~A’ sería V en todos los modelos de T, en contradicción con lo 
anterior, y, si no los tiene, ~A’ tendría que ser F en las estructuras donde son 
válidos los demás axiomas de T[~A’], esas estructuras son los modelos de T y =A’ 
sería F en los modelos de T. a 


Teorema 2. Teorema de validez 
Para toda fórmula A de L(T), si Tha entonces T EA. 


Es decir, las fórmulas que son teoremas de T son también válidas en T: la 
corrección sintáctica implica la corrección semántica. 


Su recíproco también se verifica y la conjunción de los dos, A es teorema 
de T si y sólo si es válida en T, se conoce como el Teorema de completud que 
estudiamos con algún detalle en la próxima sección 1.4. 


Como anunciábamos en la Introducción a este capítulo, la semántica 
posibilita que la Lógica simbólica resuelva problemas reales y es así porque, 
precisamente el teorema de validez establece que hay un puente entre sintaxis y 
semántica. Cuando se formaliza un problema en un dominio real mediante un 
lenguaje y una teoría de primer orden hay que hacerlo adecuadamente. Eso significa 
que los axiomas no lógicos de la teoría que se ha construido han de ser válidos en el 
domino del problema, es decir, que dicho dominio es un modelo de la teoría. El 
teorema de validez garantiza que los teoremas (simbólicos) que obtengamos 
sintácticamente, también son válidos en el dominio y, por tanto, son soluciones reales 
al problema planteado. 


Demostración. Puesto que la definición de teorema de T es inductiva (los 
teoremas más sencillos son los axiomas y el resto se genera a partir de otros 
previos por medio de reglas lógicas, véase Apéndice A, A.l, Ejemplo 3) si 
queremos demostrar que todos son válidos en T basta que probemos primero que 
los axiomas son válidos en T (Paso básico) y, después, que si las premisas de 
cualquier regla lógica verifican la Hipótesis de Inducción (ser válidas en T), 
entonces la conclusión es válida en T (Paso inductivo). Véase también A.2, 
Ejemplo 2. 


Paso básico. Los axiomas lógicos son (lógicamente) válidos. La 
demostración no requiere más que aplicar la definición de validez, más abajo 
presentamos un ejemplo. Por tanto son válidos en particular en las estructuras que 
son modelos de T y son válidos en T. Los axiomas no lógicos son trivialmente 
válidos en T por definición de modelo de T. 
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Paso inductivo. Si, respectivamente, A, A v A, A v (B v C), A > B (con x 
no libre en B en este caso) y, finalmente, A v B y = A v C (premisas, 
respectivamente, de las reglas de expansión, contracción, asociativa, introducción 
del cuantificador existencial y corte) son válidas en T (hipótesis de inducción), 
entonces, respectivamente, BvA, A, (A v B) v C, 3x A > B y B v C son válidas 
en T. Estas últimas fórmulas son las conclusiones de las reglas arriba mencionadas. 
La demostración es también inmediata y también presentamos un ejemplo más 
abajo. El resultado se puede interpretar como una corrección semántica de las 
reglas: preservan la validez en teorías, si una regla actúa sobre fórmulas válidas en 
T, devuelve fórmulas válidas en T. z 


Ejemplo 1. Validez del axioma de sustitución 


El axioma de substitución es lógicamente válido (es decir, válido en toda 
estructura). En efecto. Sea M una estructura cualquiera y sea A’ [a] —> 3x A’ una 
M-instancia cualquiera del axioma A [a] > 3xA. Si M(A” [a] > 3xA”) fuera F, 
tendríamos que M(A’,[a]) sería V mientras que M(x A”) sería F. Si i es el nombre 
de M(a) en L(M), se demuestra por una sencilla inducción que M(A” [a]) y 
M(A” [i]) son lo mismo: V como hemos supuesto, pero eso estaría en contradicción 
con que M(3xA”) sea F pues, por definición de la semántica del cuantificador 
existencial tendríamos que M(A” [j]) es F para todo nombre j, y en particular para 
i. Por tanto, A” [a] > 3x A’ es V en My, al ser M y la propia M-instancia A” [a] 
> dx A’ arbitrarias, resulta que A [a] — 3x A es válida en toda M. 


Nótese que, en un abuso de notación, estamos empleando el símbolo = 
(que, en principio, es un símbolo lógico de algunas teorías) para representar la 
identidad real, en este caso entre valores V y F. Mientras no haya riesgo de 
ambigiiedad, mantendremos esta práctica e incluso la ampliaremos a la identidad 
de fórmulas en el próximo capítulo. 


Ejemplo 2. La regla de corte preserva la validez 


Si las premisas A vB y 4 v C de la regla de corte son válidas en una 
estructura M, demostremos que entonces la conclusión B v C es válida en M. 
Recuérdese que, por definición de validez en T, eso implica que si A v B y =AvC 
son válidas en T entonces B v C es válida en T. Recordemos que, también por 
definición, la validez de B v C en M significa que toda M-instancia B’ v C’ de B v 
Ces V en M. 
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Sea B’ v C’ una M-instancia cualquiera de B v C y A’v B’, ~A’v C’ las 
correspondientes (con las mismas sustituciones, cuando sean aplicables) M- 
instancias de las premisas, A v B y — A v C. Como, por hipótesis y por definición 
de validez en M, ambas A’v B’, ~A’v C’ son V en M, entonces 


si M(A”) es V, M(~A’) es F, y como ~A ’v C’ es V en M, M(C’) es Vy 
( M(B’v C’) es V 


si M(A”) es F, como M(A’v B”) es V, M(B’) es V y M(B’v C”) es V 


(en ambos casos se ha aplicado dos veces la definición del significado de la 
disyunción). 


Resulta por tanto que cualquier M-instancia de B v C es V en M y, por 
tanto, la fórmula es válida en M. 


Ejemplo 3. Contraejemplos. Comprobación de que una fórmula no es 
teorema 


Como hemos señalado más arriba, una de las aplicaciones del teorema de 
validez es la determinación de las fórmulas que no son teoremas de una teoría. Si 
queremos demostrar que la fórmula 3x (R(x) A S(x)) no es un teorema de T[A,, A,, 
As] con A; : Vx P(x) v Vx Q(x), Az : Vx (Ax P(x) > R(G0) y A; : =3x Q(x) v 
Vx S(x), vamos a construir un modelo de la teoría, M, donde 3x (R(x) A S(x)) no 
sea válida (un contraejemplo) como sigue. El universo de M, |M| = (0) consiste en 
el número cero y los predicados de M se definen así: Pu = {0} = Ry, Qu = { } = Sm, 
{ } el conjunto vacío. Ampliamos el lenguaje en que están escritas A¡, A, y A; con 
el nombre io del número cero. 


Con estas definiciones, A,, A, y A; son válidas en M. Basta aplicar las di- 
versas definiciones de significado para cuantificaciones, implicaciones, negaciones 
y disyunciones, teniendo en cuenta, por ejemplo, que, por la definición de Py, 
M(P(i)) = Pu(MG)) = V, para todo nombre i (en este caso no hay más nombre que 
el nombre io del 0) y, por tanto, M(Vx P(x)) = V. Del mismo modo se ve que M(3x 
P(x)) = V al ser M(P(i0)) = Pu (M(io)) = V, para un nombre io, el del 0. De forma 
análoga se estudian el resto de las fórmulas concluyendo que M(A;) = V para i=1,2 
y 3 y, al ser las tres fórmulas cerradas, son también válidas en M. 


En cuanto a M(3x (R(x) A S(x))) se tiene que M(S(i)) = Sy (M(i)) = F, para 
todo nombre i y por definición de Sy. Por tanto M((R(i) A S(i)) = F para todo 
nombre i (definición del significado de la conjunción) y M(Ax (R(x) A S(x)) = F 
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(definición del significado de la cuantificación existencial). Como antes, al tratarse 
de una fórmula cerrada, resulta que 3x (R(x) A S(x)) no es válida en M. Pero M es 
un modelo de T[A,, A», As] por lo demostrado sobre la validez en M de los tres 
axiomas. 


En resumen, 3x (R(x) A S(x)) no es válida en todos los modelos de T[A,, 
A», As], por tanto no es válida en T[A,, A>, Ax], no ocurre T[A,, A, As] 
x(RG9AS(x)) y como, por el teorema de validez, T[A,, A>, As] F 3x(R(x)AS(x)) 
implica T[A,, A,, As] F dx (R(x) A S(x)), su contra recíproco demuestra que no 
ocurre T[A,, A>, As] F Ax (R(x) A S(x)). 


1.4 COMPLETUD, CONSISTENCIA Y DECIDIBILIDAD 


En 1930 Kurt Gódel comenzó la publicación de sus famosos teoremas, 
tanto de completud como de incompletud, que hicieron tambalear el edificio 
proyectado para las Matemáticas por David Hilbert unos años antes. Por supuesto, 
Gódel no fue un terrorista intelectual sino que, muy al contrario, sus trabajos 
produjeron un avance en el conocimiento científico que es, en opinión de muchos, 
único en la Historia de la Ciencia. 


En 1900 David Hilbert (Hilbert, 1901) propuso a la comunidad matemática 
los problemas más importantes, aún no resueltos, que, a su juicio, deberían marcar 
el curso futuro de las Matemáticas. Uno de estos problemas era el de la 
consistencia de una lógica, la teoría formal de la Aritmética; otro, el de decidir por 
un procedimiento efectivo (que en términos actuales podría ser, por ejemplo, un 
programa) si una fórmula de un lenguaje de primer orden es o no válida en cierta 
teoría. La forma concreta en que Hilbert planteó este problema de decisión en 1900 
fue en el contexto de las ecuaciones conocidas como diofánticas. Más tarde 
(Hilbert, Ackermann, 1928), publicaría la forma general del problema para la 
lógica matemática que desde entonces se conoce como el problema de la decisión 
(entscheidungsproblem) por antonomasia. 


Como cabe suponer, todos estos problemas ya habían sido considerados 
infructuosamente con anterioridad y el Programa de Hilbert impulsó nuevos 
intentos de solución que, por lo que se refiere al problema de la decisión, 
fracasaron igualmente, incluso para fórmulas particulares y particularmente 
interesantes, como el último teorema de Fermat. Este hecho, junto con la larga 
búsqueda de soluciones de otros muchos problemas clásicos, hizo pensar que la 
existencia de tal procedimiento de decisión era altamente improbable. Igualmente 
improbable, sin embargo, parecía la demostración de su no existencia. La respuesta 
negativa (no existe tal procedimiento) llegó sin embargo como una consecuencia, 
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entre otras muchas, de los resultados de Gédel y se demostró explícitamente en 
1936 por parte de Alonzo Church y Alan Turing en dos trabajos independientes. El 
resultado es conocido universalmente como Indecidibilidad de la Lógica de primer 
orden y una formulación precisa del mismo es la que presentamos más adelante. 
Algunos de los textos originales de este brillante momento de la historia pueden 
verse en (Davis, 1965). 


Creemos que el contenido de esta sección importa a cualquiera que se 
aproxime a la Lógica con algún interés por mínimo que sea. El lector que desee ir 
más allá de los resultados que siguen debe advertir algunas cosas sobre la 
bibliografía que se cita. Primero, que allí puede encontrar notas históricas y un 
número de resultados interesantes mucho más amplio que el que aquí incluimos y 
segundo, que las demostraciones, que no podemos dejar de citar, exceden 
notablemente el nivel de conocimientos en que se mueve el presente texto. 


Completud 


Como ya anunciamos al estudiar el teorema de validez en la sección 
anterior, Teorema 2, el teorema de completud es el que incluye al propio teorema 
de validez y su recíproco. Presentamos a continuación el enunciado del mismo 
junto a otra versión equivalente que tiene un importante papel en la demostración 
automática de teoremas; y en la que se cambian los conceptos de teorema y validez 
por los de consistencia y modelo. Ambas versiones se deben a Gédel, aunque a 
veces se atribuyen a Henkin cuyo trabajo consistió en darles una generalidad 
mayor, aquí innecesaria. Las demostraciones pueden verse en múltiples textos 
como, por ejemplo, (Mendelson, 1997). 


Teorema 1. Teorema de completud 
(Primera versión) Una fórmula A del lenguaje de una teoría T es teorema de T 
si y sólo si es válida en T. 
(Segunda versión) Una teoría T es inconsistente si y sólo si no tiene modelos. 
Ejercicio 1. Demuéstrese que la segunda versión del teorema de completud 
implica la primera. 


Consistencia 


A la vista del teorema de completud y de que en el teorema de validez, 
Teorema 2 de 1.3.3, vimos que cualquier estructura es modelo para una teoría sin 
axiomas no lógicos, es inmediato el siguiente resultado: 
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Teorema 2. Teorema de consistencia de la Lógica de primer orden 


Toda teoría de primer orden que tiene modelos es consistente, en 
particular, la Lógica de primer orden o Cálculo de predicados (la teoría sin más 
axiomas que los lógicos) es consistente. 


Es notable la potencia del trabajo de Gódel que permite despachar la 
consistencia con semejante facilidad; y, aún más allá, (aunque no podamos entrar 
en detalles) prueba que ninguna teoría consistente y que contenga a la Aritmética 
puede demostrar su propia consistencia como un teorema de la propia teoría. 
Nótese que, de acuerdo con esta afirmación, nuestra prueba de la consistencia es un 
meta teorema. 


Nota 1. Consistencia, inconsistencia, satisfacibilidad e insatisfacibilidad 


Frecuentemente se llama insatisfacible a una teoría inconsistente o al 
conjunto de sus axiomas no lógicos. Una teoría es insatisfacible, en su definición 
original, si no tiene modelos. En lo que sigue, y si no hay lugar a confusión, 
llamaremos también insatisfacible al conjunto de los axiomas no lógicos de la 
teoría insatisfacible que, como sabemos, la determina univocamente. Naturalmente, 
una teoría, o sus axiomas no lógicos, es satisfacible si tiene un modelo. En 
términos de las fórmulas que son los axiomas se hablará, equivalentemente, de la 
existencia o no de modelos para las mismas (estructuras donde dichas fórmulas 
sean válidas). 


El teorema de completud en su segunda versión establece la equivalencia 
entre la inconsistencia y la insatisfacibilidad de un conjunto de fórmulas y nos da la 
libertad de usar indistintamente ambos términos. De la misma forma, el teorema de 
completud convierte en equivalentes los intentos de búsqueda, y los hallazgos, de 
procedimientos para decidir tanto que una fórmula es teorema de T como que es 
válida en T. Ésta es la razón por la que, según la conveniencia del momento, se 
usará como condición equivalente la inconsistencia, en unos casos, o la 
insatisfacibilidad, en otros, del conjunto de los axiomas no lógicos junto con la 
negación del cierre de la fórmula en cuestión. 


Así, en el cálculo por tablas analíticas de la sección 1.2 se buscaba obtener 
la mencionada inconsistencia por medio de lo que allí se definió como refutación. 
Por otra parte, el objetivo de algunos algoritmos de demostración automática para 
el sistema de Resolución, que estudiaremos en los capítulos siguientes, consiste en 
probar una condición equivalente a la insatisfacibilidad del referido conjunto 
formado por los axiomas de una teoría junto con la negación del cierre de la 
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fórmula que se quiere probar. Curiosamente, también se llamarán refutaciones a las 
implementaciones informáticas de la comprobación de dicha condición. 


Decidibilidad 
Teorema 3. Indecidibilidad de la Lógica de primer orden 


No hay ningún procedimiento efectivo (equivalente, por ejemplo, a una 
máquina de Turing) que para toda fórmula, A, del lenguaje L de la Lógica de 
primer orden, concluya en un tiempo finito si A es válida en dicha Lógica o no. 


Sin embargo si A es válida en la Lógica de primer orden, hay un 
procedimiento efectivo que concluye ese hecho. 


La segunda afirmación no se refiere, naturalmente, a la indecidibilidad, 
sino a lo que se conoce como decidibilidad parcial y que, por su estrecho 
parentesco, la hemos incluido con la mencionada indecidibilidad. La demostración 
puede verse en (Mendelson, 1997) y (Odifreddi, 1989) y tanto en esos textos como 
en las múltiples referencias que recogen pueden verse diversos ejemplos 
adicionales de indecidibilidad y decidibilidad. 


Además, así como la indecidibilidad tiene una demostración que excede el 
propósito y los límites de este texto, la decidibilidad parcial es muy fácil de deducir 
al menos informalmente. En efecto, no cuesta mucho imaginar una manera efectiva 
y linealmente ordenada de generar, con suficiente tiempo, todos los teoremas de 
una teoría cualquiera T. Por ejemplo, se pueden colocar todos los axiomas en una 
primera etapa e ir generando las siguientes por aplicación del conjunto finito de las 
reglas a cada etapa anterior. Si A es un teorema de T, aparecerá en algún momento 
que será cuando el procedimiento termine con la afirmación “A es teorema de T”, y 
válida en T por el teorema de validez. Obviamente el procedimiento no vale para 
toda A, incluidas las que no son teoremas de T, como afirma la indecidibilidad, 
pues en este segundo caso no terminará. 


Las demostraciones de la indecidibilidad son de considerable dificultad 
técnica, pero tienen un trasfondo fácilmente comprensible y estéticamente notable. 
El hecho de ser teorema, o una fórmula válida, en T se reduce a la terminación de 
un programa, una máquina de Turing o algún procedimiento equivalente, lo cual 
puede parecer asombroso, pero está rigurosamente demostrado. 


Todos hemos leído u oído acerca de la solución efectiva, mediante 
programas, de muchos problemas que, como ya habíamos comentado, habían 
resistido durante décadas a tal solución. El lector no habituado a los términos que 
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hemos introducido puede ver en estos hechos un argumento contra la 
indecidibilidad. Ante semejante posibilidad, debemos subrayar dos conceptos que 
han podido quedar insuficientemente aclarados. Primero: no todo sistema formal es 
indecidible. El ejemplo que sigue del Cálculo de proposiciones no deja lugar a 
dudas y no es el único ni mucho menos. Lo que sí es indecidible, porque lo 
demuestra el correspondiente teorema, es la Lógica de primer orden. Segundo: la 
afirmación del teorema consiste en que no hay un procedimiento para decidir todas 
las fórmulas de la Lógica de primer orden. Nada se opone a la existencia de 
cuantos procedimientos ad hoc puedan imaginarse, cada uno para una decisión. 


Nota 2. Decidibilidad del cálculo de proposiciones 


La indecidibilidad de la lógica de primer orden no supone, naturalmente y 
como acabamos de comentar, la de cualquier sistema formal. Sutiles particulariza- 
ciones de esa Lógica resultan ser decidibles, como puede verse en las referencias 
citadas más arriba. 


La decidibilidad del ejemplo más sencillo fue demostrada por Post en 
1921, aunque ahora sea una cuestión elemental para cualquier estudiante 
mínimamente advertido. Se trata de la Lógica, o Cálculo, de proposiciones que 
estudiamos en la siguiente sección y donde, en particular, veremos el 
procedimiento de decisión para la misma. 


1.5 LA LÓGICA DE PROPOSICIONES 


Una Lógica de proposiciones se definió en la sección 1.1.2, Nota 3, como 
una teoría de primer orden donde no se consideran las variables, los 
cuantificadores, los símbolos de función, ni los símbolos de predicado n-ario para 
n21 y el único axioma lógico es el proposicional. En otras palabras, no hay más 
símbolos de predicado que los 0-arios que, por tanto, son también fórmulas 
atómicas y que, en este contexto, se llaman proposiciones. 


Esta considerable simplificación hace muy sencilla la utilización de la 
Lógica proposicional, como veremos, y la demostración de teoremas en particular. 
La mencionada simplificación no es meramente cuantitativa, una reducción del 
esfuerzo, sino que va más allá pues, como anunciábamos, cualquier lógica 
proposicional es decidible. Por eso, quien tiene que resolver un problema que se 
puede representar adecuadamente en el lenguaje de las proposiciones no dudará en 
hacerlo así, tanto si se propone hacer las demostraciones a mano (los métodos que 
hemos visto hasta ahora) como si va a emplear algún demostrador automático 
como los que veremos más adelante o cualquier otro. 
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La contrapartida es una expresividad muy reducida del lenguaje. La 
sentencia con la que comenzábamos este capítulo “si este fin de semana nieva y he 
terminado el balance iré a esquiar” se puede representar en el lenguaje de 
proposiciones como ya vimos, N A T — E, con los tres símbolos de predicado 0- 
ario (proposiciones) N, T y E. Sin embargo, la ligera variación que también 
apuntamos en 1.1 como “los que terminan el balance van a esquiar” perdería su 
capacidad expresiva escrita en la forma T — E. Por ejemplo, no podría deducirse 
que si Juan termina el balance va a esquiar. Esto requeriría el uso de símbolos de 
predicado unoarios y empezar por representar la primera frase así: Vx(T(x) > 


E(x)). 


Como caso particular que es de las teorías de primer orden, en una lógica 
proposicional se podra hablar de un lenguaje, unos axiomas y reglas, una semantica 
y unos meta teoremas que también aqui se verifican, como el teorema de tautologia 
y el de completud. 


De la misma forma, pero mirando hacia delante, el método de resolución, 
que se definirá en el ámbito de las teorías de primer orden, tiene su versión para 
proposiciones (la resolución básica, Teorema 2 de 2.3.3); y la descomposición en 
cláusulas y, particularmente, en cláusulas de Horn (secciones 2.1.4 y 1.5.3), tiene 
tanto interés en lógica proposicional como en teorías de primer orden en general. 


En lo que sigue vamos a recapitular y expandir algunas de las ideas 
enunciadas en la anterior introducción. 


1.5.1 Sintaxis 


El lenguaje de una lógica proposicional está determinado cuando se dan 
sus símbolos no lógicos, es decir, un conjunto Py de símbolos de predicado cero- 
ario que llamamos proposiciones. El resto de los símbolos lógicos primitivos se 
reduce a — y v, que se extienden a los símbolos definidos (A, — y +>) en la forma 
habitual. Véase la Definición 4 de 1.1.1. 


Como ya señalamos, al no haber variables ni símbolos de función, el 
lenguaje carece de términos y las fórmulas pueden ser atómicas, P, una 
proposición, o negaciones y disyunciones de fórmulas más sencillas: si C y D son 
fórmulas, entonces: =C y C v D son fórmulas. 


Así resulta que en la lógica proposicional las fórmulas elementales que 
definimos en 1.1.3 (Definición 1) no son más que las fórmulas atómicas o 
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proposiciones. Volveremos a considerar lo relacionado con estas fórmulas y las 
valoraciones al hablar de la semántica. 


Una lógica proposicional tiene como axiomas los axiomas proposicionales, 
=AvA, donde A es una fórmula cualquiera (axiomas lógicos), más algunas 
fórmulas seleccionadas para formar parte de los axiomas y que se llaman axiomas 
no lógicos. Las reglas lógicas son expansión, contracción, asociativa y de corte 
(véase Definición 1 de 1.1.2) y los teoremas y las pruebas se definen exactamente 
igual que en la Sección que acabamos de citar: son teoremas los axiomas y las 
fórmulas obtenidas a partir de teoremas mediante reglas. 


Ejemplo 1. Una deducción en Lógica de proposiciones 


Consideremos un segmento trivial de un programa que calcula el máximo 
entre x e y y asigna dicho máximo a la variable x 


if x=y then x =x 

else if x > y then x =x 
else if y > x then x = y 
end if 


Utilizaremos la proposición M para representar que x es mayor que y antes 
de ejecutarse el segmento, la proposición m para representar que x es menor o 
igual que y antes de ejecutarse el segmento y la proposición X para representar que 
x es el máximo entre x e y después de ejecutarse el segmento. Así tenemos un 
lenguaje proposicional {M, m, X} y la semántica del segmento de programa está 
representada por los axiomas no lógicos M v m, M > X y m —> X. Que X es un 
teorema se interpreta como la corrección de dicho segmento y esto se puede 
demostrar de forma elemental 


1.Mvm axioma 

2.M>X axioma 

3.MvX definición de 2 

4.mvX consecuencia tautológica 1 y 3 
5.m—X axioma 

6. mv X definición de 5 


TOR consecuencia tautológica 4 y 6. 
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La sencillez de la prueba tiene como objetivo el poder reutilizar el ejemplo 
más tarde en otro contexto y que los detalles no oscurezcan los conceptos que 
pretendemos ilustrar. Por otra parte, una demostración proposicional más realista 
que la anterior puede ser más larga, pero no más complicada tanto conceptualmente 
como desde el punto de vista del procedimiento. 


1.5.2 Semántica 


Por guardar la relación de caso particular a caso general que se da entre la 
lógica proposicional y la de predicados o teorías de primer orden, una estructura 
para un lenguaje proposicional tendrá un universo. Sin embargo, no se hará ningún 
uso de tal universo porque el lenguaje proposicional no tiene términos cuyo 
significado requiera los individuos del universo. 


Por tanto, y desde el punto de vista de su utilización, la semántica de un 
lenguaje proposicional se reduce a una estructura que consiste en el conjunto Po 
de los predicados 0-arios V y F, véase la Nota 1 de 1.3, y una asignación de uno de 
estos predicados V o F a cada proposición (cada símbolo de predicado 0-ario que, a 
su vez, coincide con una fórmula atómica). 


Los significados del resto de las fórmulas se definen en la forma habitual 
en teorías de primer orden: M(—A) es V si y sólo si M(A) es F y M(C v D) es F si 
y sólo si M(C ) y M(D) son F. Nótese que, en este contexto, no tiene sentido la 
distinción entre fórmulas cerradas y no cerradas, y, por tanto, el hecho de que A es 
válida en M equivale a que A es V en M. En consecuencia, los modelos de un 
conjunto de fórmulas son las estructuras donde todas ellas son V. 


My mm Xu  M(Mvm) M(M>X)  M(m>X) 
CNN V V V 
EEN oe v F F 
MARY v V v 
AS v F v 
Eo ever Y v V v 
EA. E v v F 
F F v F vV v 
F oF F F v v 

Tabla 1.1 


Así en el ejemplo anterior, una posible estructura M es la asignación Mm = 
V, mm = V y Xu= V. Y todas las posibles estructuras no son más que todas las 
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asignaciones de los dos predicados V y F a los tres símbolos M, m y X: ocho 
combinaciones con repetición de los predicados V y F. 


Si disponemos esas ocho asignaciones en ocho líneas consecutivas 
tendremos una tabla de verdad como la Tabla 1.1, donde cada línea es una 
estructura para el lenguaje {M, m, X} y en la cual también se han calculado los 
correspondientes significados de los axiomas no lógicos. 


Las tablas de verdad, como en el ejemplo anterior, son siempre finitas: 
tienen 2* filas, donde k es el número de símbolos, proposiciones, del lenguaje y su 
utilidad se sigue del contenido de los teoremas que siguen. 


Cuando no haya lugar a confusión, omitiremos la mención a una estructura 
M en la línea que encabeza la tabla. En nuestro ejemplo quedaría así 


M m X Mym M>X m— xX 


que es la forma mas habitual de escribir siempre en el entendimiento de que los 
predicados V o F debajo de cada férmula son sus significados en cada una de las 
correspondientes estructuras. Sería incorrecto decir que los predicados V o F son 
valores de las fórmulas que en sí mismas son simbólicas y como tales no tienen ni 
dejan de tener valores. 


Teorema 1. Modelos del cálculo de proposiciones 


En una tabla de verdad para el lenguaje de una teoría proposicional se 
puede decidir en un número finito de pasos qué estructuras son y cuáles no son 
modelos de la teoría. 


Basta comprobar en qué líneas de la tabla todos los axiomas no lógicos 
tienen el significado V y eso es una tarea finita. En el ejemplo se han señalado en 
negrita los tres modelos que hay para la teoría T con axiomas no lógicos M v m, 
M> X y m > X, líneas primera, tercera y quinta. 


Teorema 2. Teoremas en las tablas de verdad 
Una fórmula del lenguaje de una teoría proposicional es teorema de la 
misma si y sólo si tiene el valor V en las líneas de la correspondiente tabla de 


verdad que son modelos de dicha teoría. 


Es una consecuencia inmediata del teorema de completud, que se cumple 
aquí como en cualquier teoría de primer orden, y de la identidad entre validez y 
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valor V en una estructura para la lógica de proposiciones. En el ejemplo se han 
subrayado los tres significados de X en los tres modelos de la teoría de ese ejemplo 
(tres V”s), con lo que X es un teorema de la teoría T. La comprobación del hecho 
en general y tal como se especifica en el teorema anterior es también finita, con lo 
que se tiene el siguiente teorema. 


Teorema 3. Decidibilidad del cálculo de proposiciones 


La lógica de proposiciones es decidible: se puede determinar en un 
número finito de pasos y mediante una tabla de verdad si una fórmula cualquiera 
es o no teorema de una teoría. 


Lo que antecede tiene una elemental consecuencia que conviene advertir. 
En las teorías de primer orden la forma sintáctica de demostración (axiomas y 
aplicaciones de reglas) era fundamental y de alguna forma imprescindible en todas 
las aproximaciones a la obtención de teoremas dentro de la propia teoría. En la 
lógica proposicional esto es casi superfluo debido a la posibilidad de usar el 
método semántico de las tablas de verdad que a su sencillez de uso une la 
seguridad de que siempre proporciona una respuesta. No hemos hablado de cómo 
demostrar aquí que una fórmula no es teorema de una teoría, pero es obvio que la 
misma tabla de verdad que daría la respuesta positiva sirve para la negativa cuando 
la fórmula en cuestión no significa V en alguno de los modelos de la teoría. 


Ejemplo 1. Demostración por tablas de verdad 


Recuérdese cómo demostramos que X era un teorema en la teoría del 
Ejemplo 1 en 1.5.1. Con el procedimiento esbozado en los resultados anteriores 
tendríamos demostrado que X es válida (V) en todos los modelos de la teoría, 
véanse las líneas primera, tercera y quinta de la tabla 1.1, y por tanto, teorema de 
completud, es teorema de la teoría. 


Nota 1. Complejidad del problema de decisión 


La decidibilidad de la lógica proposicional significa que, para toda 
fórmula, se puede saber efectivamente y por un único procedimiento si es o no 
teorema de cierta teoría, pero no significa que esa decisión sea un problema fácil. 
Como, según el Teorema 5 de 1.3.3 y el teorema de completud, el que A sea 
teorema de T se reduce a la (no) satisfacibilidad de T[A] (que se puede resolver 
igualmente por el examen de la tabla de verdad), tradicionalmente se denomina 
Satisfacibilidad o SAT al problema de decisión en lógica de proposiciones. Y la 
dificultad de SAT se precisa en el sentido de que el número de comprobaciones que 
lleva consigo es proporcional a 2*, número de filas de una tabla de verdad para un 
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lenguaje con k proposiciones. Se trata de un número de pasos que es función 
exponencial del tamaño, k, del problema y tanto la teoría como la práctica 
muestran que un procedimiento con ese tiempo de ejecución (cada paso requiere un 
tiempo aunque sea elemental, una unidad mínima en cierto sentido) no termina en 
un plazo razonable, salvo para valores triviales de k. Esta característica del 
procedimiento se conoce como complejidad exponencial en contraste con los 
algoritmos cuyo tiempo de ejecución es función polinomial del tamaño del 
problema y que son tratables, en el sentido de que se pueden ejecutar en plazos 
asumibles. 


La complejidad siempre se estudia en el peor caso, es decir, el caso de 
nuestro ejemplo en el que hubiese que recorrer las 2* filas de la tabla de verdad 
para llegar a la decisión de que se trate. Obviamente esto no ocurrirá siempre, pero 
en un estudio general no sabemos cuándo y en cuántos casos sucede. Queremos 
decir que la complejidad del procedimiento en sí se debe medir por la función 2* y 
que, no pudiendo considerar significativos los ejemplos particularmente simples, tal 
complejidad no se puede mejorar sin cambiar de procedimiento. En la Sección 
siguiente estudiamos un subconjunto de la Lógica de proposiciones que es 
particularmente interesante, entre otras cosas porque admite un procedimiento de 
decisión de complejidad polinomial. 


Nota 2. Tautologías, validez y conceptos relacionados 


Es probable que el lector ya se haya percatado de algunas relaciones 
particulares entre fórmulas elementales, proposiciones, valoraciones, semántica, 
validez y tautología. Todos estos conceptos perfectamente definidos y distinguidos 
en las teorías de primer orden en general, deben seguir igual de precisos y distintos 
en la lógica proposicional, pero no debemos ignorar que, en este caso particular, los 
objetos definidos por algunos de esos distintos conceptos resultan ser los mismos. 


Ya hemos hecho notar más arriba que las fórmulas elementales en lógica 
proposicional son todas y solas las proposiciones (fórmulas atómicas que constan 
de un único símbolo de predicado 0-ario). Por definición, en una estructura 
cualquiera para un lenguaje proposicional, se asignan significados V y F a cada 
proposición (fórmula elemental) y luego se extiende esa asignación por las mismas 
reglas que se usaban en las valoraciones. Esto quiere decir que, en lógica 
proposicional, no hay ninguna diferencia real entre valoración y estructura, aunque, 
por definición, ambos conceptos estén tan alejados como un objeto sintáctico (la 
valoración) y uno semántico (la estructura). 


Si esta distinción conceptual está suficientemente clara, no hay ningún 
inconveniente en intercambiar (como en la práctica se hace) los términos 
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valoración y estructura, como también resultan intercambiables tautología y 
fórmula válida (la que tiene asignado V en toda valoración, o estructura) y la 
consecuencia tautológica con la consecuencia lógica. 


Permitasenos, sin embargo, recordar la opción que hemos asumido en 
nuestra exposición de las teorías de primer orden y que no es la más habitual en 
los textos: los conceptos de valoración y estructura están totalmente separados por 
la misma frontera que marca la diferencia entre lo sintáctico y lo semántico y, de 
hecho, sus “productos” (tautologías, por un lado, y fórmulas válidas por otro) no 
coinciden. En efecto, en una teoría cualquiera T, desde el punto de vista sintáctico, 
las tautologías son teoremas, pero no todo teorema es una tautología; mientras que, 
entrando en lo semántico, las fórmulas válidas en T coinciden con sus teoremas, 
pero no con las tautologías. En lógica proposicional los tres conceptos (tautología, 
teorema de T y fórmula válida en T) abarcan las mismas fórmulas, pero es un caso 
particular y es esa particularidad la que hemos querido subrayar. 


Para terminar y recapitulando conceptos tanto de la lógica proposicional 
como de la de predicados, se puede decir que las valoraciones que definimos en su 
momento para un lenguaje de primer orden cualquiera L no son sino la semántica 
de un lenguaje proposicional cuyas fórmulas atómicas son las fórmulas elementales 
deL. 


1.5.3 Cláusulas de Horn 


Definiciones 1. Cláusulas, literales, cláusulas de Horn 


Dado un lenguaje de primer orden cualquiera L, se llama literal a una 
fórmula atómica o a la negación de una fórmula atómica. Una fórmula atómica se 
dice que es un literal positivo y la negación de una fórmula atómica un literal 
negativo. Si L; son literales, una cláusula es una fórmula de la forma L, v L; v ...v 
Lk. Una cláusula de Horn es la que tiene a lo sumo un literal positivo y es 
afirmativa cuando tiene exactamente un literal positivo y negativa cuando sólo 
consta de literales negativos. Llamaremos cláusula unitaria a la que consta de un 
solo literal. 


Es interesante considerar estos tipos particulares de fórmulas tanto por su 
utilidad en el tratamiento de aplicaciones prácticas, como por la peculiaridad de 
tratamientos teóricos como el que hace Kowalski en su “Logic for problem 
solving” de reconfortante lectura por su sencilla profundidad y potencia. De hecho, 
la lógica clausal (que no considera más fórmulas que las cláusulas) es el lenguaje 
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más utilizado para la deducción automática; y la resolución y la programación 
lógica son dos ejemplos importantes que estudiaremos en los siguientes capítulos. 


Las cláusulas aparecen de forma natural cuando se estudian las formas 
normales: la forma conjuntiva y su correlativa, la forma normal disyuntiva tal 
como se definen en los dos ejercicios siguientes. 


Ejercicio 1. Forma normal conjuntiva 


Demuéstrese que para toda fórmula de la lógica de proposiciones existe 
otra en forma normal conjuntiva (una conjunción de disyunciones de literales) que 
es lógicamente equivalente a la primera. Una demostración para teorías de primer 
orden está en la sección 2.1.4 del capítulo siguiente. Un ejemplo de obtención de 
una forma normal conjuntiva es el proceso que estudiamos en el Ejemplo 1 de 1.1.3 
para decidir si la formula A>B — A A B era o no tautología. La trasformación en 
su forma normal conjuntiva se hace por operaciones muy similares, véanse los 
detalles en el propio ejemplo. Pasamos de la fórmula dada a =A v —B v (A ^ B), 
de ésta a “A v "Bv (A > B) y luego a A v =B v =(—A v —B), que, 
finalmente proporciona (A v ~B v A)A(=A v —B v B). 


Ejercicio 2. Forma normal disyuntiva 


Demuéstrese que para toda fórmula de la lógica de proposiciones existe 
otra en forma normal disyuntiva (una disyunción de conjunciones de literales) que 
es lógicamente equivalente a la primera. Aquí puede usarse la tabla de verdad de la 
fórmula, asociando a cada estructura que la haga V una conjunción donde se coloca 
como literal positivo cada proposición que sea V y como literal negativo la 
negación de cada proposición que sea F. Por ejemplo, la fórmula (M v m) ^ (M > 
X) A (m > X) que es la conjunción de los tres axiomas de la teoría de 1.5.1 con la 
Tabla 1.1, se escribirá (M A m A X) v (M ^a ~m AX) v (~M ^ ma X) atendiendo 
a las líneas 1, 3 y 5 que son las estructuras que la hacen verdadera. 


Una de las razones que hacen interesante la introducción de las cláusulas 
de Horn en este contexto y también más adelante es que, a cambio de restringir 
ligeramente el lenguaje, nos capacita para resolver problemas de una forma 
realista: existe un procedimiento que permite decidir en tiempo polinomial si un 
conjunto cualquiera de cláusulas de Horn es o no satisfacible. (Recuérdese que si 
podemos decidir la satisfacibilidad lo mismo se puede decir de los teoremas porque 
que A sea teorema de T se reduce a la (no) satisfacibilidad de T[A].) Como 
veremos a continuación, el núcleo del algoritmo está en la adecuada gestión del 
hecho de que una cláusula de Horn tiene a lo sumo un literal positivo. 
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Procedimiento SAT para decidir la insatisfacibilidad de un conjunto 
de cláusulas de Horn, P = {C,, C2, ..., Cx} 


U = {conjunto ordenado de los literales, A, de las clausulas afirmativas 
unitarias de P} 
mientras U + ® (conjunto vacío) 
empezar, sea A el primer literal de U 
1 por cada cláusula de P de la forma B v A, se modifica P 
suprimiendo dicha cláusula, P := P—{B vA} 
2 por cada cláusula de P de la forma B’ v>A v A’, se modifica P 
cambiando dicha clausula por B’ v A’, 
P:=P-{B’v-A vA} Uf{B’ vA} 
(B y B’ son cláusulas negativas, A’ es afirmativa y cualquiera de 
ellas puede ser vacía) 
3 por cada cláusula afirmativa unitaria C = A” de P, se modifica 
U, 
U:=UU(A”), con A” como última proposición de U 
Si alguna cláusula, de P modificado, es ~A, entonces escribir “P 
es insatisfacible” y parar 
sino U:= U- {A} 
fin 
escribir “P es satisfacible” y parar. 


Teorema 1. Corrección y completud de SAT 


El algoritmo anterior utilizado para determinar la insatisfacibilidad o 
inconsistencia de un conjunto de cláusulas de Horn es correcto y completo.(Los 
conceptos de corrección y completud se definen en el Ejercicio 6, 1.1.3.) 


Nótese que tanto en el algoritmo como en el teorema no se considera el 
orden dentro de las cláusulas y que esto no tiene ninguna influencia sobre la 
satisfacibilidad o insatisfacibilidad. Así, no se distinguen las cláusulas A’v ~B; v 
ZA v -B2 y -Bı v ~B2v “A v A’ y las operaciones diferencia y unión se entienden 
en su sentido conjuntista. Este proceder se usará también más adelante salvo en 
casos especiales como la resolución ordenada, véase 3.1.2. 


Demostración 


Corrección. Supongamos que el algoritmo termina escribiendo “P es 
insatisfacible”. Si en P hay cláusulas afirmativas unitarias, A, y M es una 
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estructura donde tales A son F, M no sería modelo de P y P, de momento, no sería 
satisfacible. Supongamos, por tanto que M(A)=V para los literales de las cláusulas 
afirmativas unitarias. Si M(C;) fuera V para toda cláusula Cj de P, cualquier 
fórmula, literal positivo, que haya estado en U en algún momento será V en M. La 
demostración por inducción sobre los pasos en los que entra cada fórmula en U no 
ofrece dificultad. Cuando termina el algoritmo es porque ha encontrado que una 
cláusula de las que en ese momento están en P es ~A, con A en U. Por tanto 
M(=A)"F. Si —A estaba en P inicialmente, ya está demostrada la insatisfacibilidad. 
Si >A proviene de una cláusula C = ~B; v — B) v ... v “A inicialmente en P, eso 
significa que se han eliminado todos los literales negativos de C hasta reducirla a 
=A y ha sido así porque todas las proposiciones B; han pasado por U. Por tanto, 
M(-B;)=F, y como era M(-A)=F, tendríamos que M(C) no puede ser V y P es 
insatisfacible. 


Completud. Demostraremos el contra recíproco: que si el algoritmo no 
termina escribiendo “P es insatisfacible”, P no es insatisfacible. Quedará así 
probado que siempre que P es insatisfacible, el algoritmo lo dice. 


Puesto que el algoritmo termina siempre (como enseguida vamos a 
demostrar), si no termina escribiendo “P es insatisfacible”, la hipótesis que se va a 
hacer, termina de la única forma que queda: escribiendo “P es satisfacible”. Por 
tanto, la demostración se reduce a su vez a probar que si el algoritmo termina 
escribiendo “P es satisfacible”, P no es insatisfacible, es satisfacible. 


El algoritmo termina siempre (y en un número de vueltas al bucle mientras 
que no supera a k, número de cláusulas en P) porque, en cada vuelta del bucle, sale 
de U un literal positivo de alguna cláusula de P, literal que no vuelve a entrar a no 
ser que forme parte de otra cláusula. Por tanto, a lo sumo en k vueltas U = © y el 
algoritmo termina. Si, como estamos suponiendo escribe “P es satisfacible”, 
termina exactamente así y no antes. 


Definamos una estructura M tal que M(A)=V para todas aquellas 
proposiciones que hayan pasado por U y M(B)=F para el resto de proposiciones en 
ps 


Si no hay ninguna cláusula afirmativa unitaria, U es vacío, todas las 
proposiciones son F en M y todas las cláusulas de P son V (todas contienen algún 
literal negativo, por ser de Horn y la hipótesis sobre la falta de cláusulas 
afirmativas unitarias). 


Si hay cláusulas afirmativas unitarias, éstas son V en M por definición de 
M. Las demás cláusulas afirmativas C="B, v — Ba v ... v A son V si A ha pasado 
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por U. En caso contrario, tiene que haber al menos una B; que no ha pasado por U, 
M(Bj)=F, por definición de M, y M(C)=V. Por último, si alguna cláusula negativa 
C =-Bı v > Bv ... v "Bj fuera F en M, todas las B; serían V, es decir, habrían 
pasado por U, y al salir de U habrían ido produciendo cláusulas cada vez más 
cortas, paso 2; si la penúltima de estas cláusulas fuese, por ejemplo y sin pérdida de 
generalidad, —B;, en una nueva vuelta posterior del bucle con B; como primer literal 
de U, el algoritmo encontraría a —B, en P y debería haber terminado con “P es 
insatisfacible” en contra de la hipótesis. 


En resumen, M(C)=V para todas las cláusulas C de P y P es satisfacible.m 
Nota 1. Sobre las cláusulas de Horn 


El resultado que acabamos de probar y las excelentes propiedades que 
veremos para la programación lógica con cláusulas de Horn subrayan el acierto que 
supone trabajar con las mismas. La restricción que suponen en el lenguaje es real: 
obviamente, no toda cláusula es de Horn. Sin embargo Kowalski (Kowalski, 1986) 
demuestra que para todo conjunto C de cláusulas existe otro C’ de cláusulas de 
Horn tal que C es inconsistente si y sólo si C’ lo es. Con este resultado como telón 
de fondo, la popularización de algoritmos para traducir a cláusulas de Horn 
problemas en contextos tan diversos como el del análisis de gramáticas 
(Matsumoto et al., 1983) y el ingenio de los programadores, raro es el problema 
que no se pueda representar de esta forma. 


Ejemplos 1. Aplicación del algoritmo SAT 


(a) Sea P = (A, ~A v B, C, -B v -C v D} que es trivialmente satisfacible, 
pero ilustra claramente el proceso general. Inicialmente U = {A, C}. Como no es 
vacío se entra en el bucle mientras. 


En la primera vuelta, con el literal A, A sale de P en el paso 1, ~A v B se 
cambia por B en el paso 2, esta nueva cláusula B sale de P y se incorpora a U en el 
paso 3 y comienza la segunda vuelta con U sin A, U = {C, B} y P = {C, 
—Bv-CvD). 


Ahora con C como nuevo primer literal de U, C sale de P en el paso 1, 
-B v -C v D se cambia por -B v D en el paso 2 y comienza la tercera vuelta con 
U sin C, U = {B} y P= {-B v D}. 
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El primer literal de U es ahora B, -B v D se cambia por D en el paso 2, 
esta nueva cláusula D sale de P y se incorpora a U en el paso 3 y comienza la 
cuarta vuelta con U sin B, U = {D} y P= { }. 


El último literal, D, de U no produce ningún efecto en P (que no tiene 
cláusulas con D ni con —D) y termina la vuelta con U sin D, U = 9, se sale del 
bucle y termina el procedimiento con la salida “P es satisfacible” como asegura el 
teorema. 


(b) Como D se deduce de las cláusulas de P, llamemos nuevamente P al 
conjunto resultante de añadir la negación de D, (A, =A v B, C, =B v -C v D, -D}, 
que ahora debe ser insatisfacible. 


En efecto, todo ocurre como en (a) salvo que ahora la evolución de P es 
{A, -A v B, C, -B v -C v D, =D), {C, -Bv-C v D, -D}, {-B v D, —D), y (7D) 
al comienzo de la cuarta vuelta, con U = {D}. Esta cuarta vuelta termina en el 
paso 3 con la salida “P es insatisfacible” como asegura el teorema. 


Capítulo 2 


RESOLUCIÓN 


Las definiciones de teorema y demostración del capítulo precedente 
carecen de toda restricción. Se puede emprender cualquier camino para demostrar 
un teorema (porque no sabemos cuál es el más conveniente) y, con tiempo 
suficiente, podemos generar todas las posibles demostraciones en una teoría de 
primer orden, pero en una lista carente de cualquier estructura. 


Las tablas analíticas eran un intento de introducir algo de procedimiento y 
estrategia en la inferencia de teoremas, en este caso reducida al hecho equivalente 
de la inconsistencia de la teoría obtenida por adición del cierre del teorema. 


Así se abre el campo casi ilimitado de los algoritmos de decisión parcial 
(véase el Teorema 3 de 1.4) para demostración automática de teoremas, de entre 
los cuales hemos elegido para exponer en esta monografía el que deriva del sistema 
formal de resolución. El sistema formal de resolución es un paso adelante de 
enorme importancia. Este método se apoya en resultados de gran calado, que le 
dotan de su potencia original y distintiva y, así, aporta sencillez y la posibilidad de 
estructurar el espacio de todas las posibles inferencias de inconsistencia o 
insatisfacibilidad. Véase la Nota 1 en 1.4 sobre las relaciones entre inconsistencia e 
insatisfacibilidad. 


El sistema está basado en una sencilla regla de inferencia que se aplica a un 
conjunto de expresiones de una versión simplificada de las teorías de primer orden, 
las cláusulas. Este segundo hecho ya reduce drásticamente el tamaño del espacio de 
búsqueda y la utilización de una sola regla permite, por un lado, analizar fácilmente 
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el procedimiento y, por otro, implementarlo eficientemente con la ayuda de 
estrategias apropiadas. 


Concretemos algo más teniendo en cuenta que todo lo que aquí se dice va a 
ser mucho más detallado en el texto que sigue. El sistema de resolución intenta 
demostrar teoremas utilizando el hecho de que son fórmulas válidas en la teoría de 
que se trate y comprobando que la teoría obtenida por adición de la negación del 
cierre del teorema no tiene modelos (Teorema 1 en 1.3.3). Demostraremos que la 
no existencia de modelos para dicha teoría es equivalente al mismo hecho para la 
teoría cuyos axiomas no lógicos son ciertas fórmulas particularmente sencillas, 
cláusulas. Veremos también que, gracias sobre todo al teorema de Herbrand, este 
hecho equivale a la deducción de la cláusula vacía en el sistema de resolución. 
Introduciremos terminología que simplifique la redacción de todas estas cuestiones 
y veremos que el procedimiento es correcto y, en un sentido, completo (véase la 
Nota 1 en 2.3.2). 


Que la resolución ofrezca un método (algorítmico, en el sentido que se 
verá) es la buena noticia frente a la ingente tarea inicial de buscar entre los infinitos 
posibles modelos de una teoría para concluir que no hay ninguno. El trabajo de 
Herbrand, y otros, redujo todo ese conjunto a una sola clase de modelos bien 
especificada y Robinson diseñó el procedimiento para discernirlos. La única 
sombra es inevitable y se llama indecidibilidad, Teorema 3 de 1.4. Veremos que la 
resolución es un procedimiento completo para decidir las fórmulas que son 
teoremas de una teoría. Nunca tendremos un procedimiento para decidir tanto las 
fórmulas que son como las que no son teoremas. 


2.1 REDUCCIÓN A UN CONJUNTO DE CLÁUSULAS 


El problema de saber si una fórmula B resulta como teorema de la teoría 
con axiomas no lógicos Aj, A» ..., An , que es equivalente al de la validez de B en 
dicha teoría, se reduce, por el Teorema 1 en 1.3.3, al problema de la 
insatisfacibilidad de la teoría T[Aj, A> ..., An, B”] donde B’ es el cierre de B, es 
decir, al de la no existencia de modelos para dicha teoría. Como ya advertimos en 
su momento, en muchas ocasiones omitiremos la mención a la teoría y diremos 
simplemente que el conjunto de los axiomas no lógicos es insatisfacible o carece de 
modelos. 


En nuestro caso, por tanto, hemos hecho una reducción de la investigación 
sobre si B es o no teorema de T[Aj, A> ..., An] a la de la insatisfacibilidad de (Aj, 
A: ...» An, 3B’}. 
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Como hemos apuntado más arriba, es el procedimiento de resolución el que 
se va a ocupar de demostrar la insatisfacibilidad que acabamos de mencionar y, 
puesto que la resolución requiere que las fórmulas sobre las que actúa tengan una 
determinada forma, que llamaremos clausal, dedicaremos esta primera sección a 
los métodos que permiten obtener un conjunto de cláusulas a partir de fórmulas 
cualesquiera de un lenguaje de primer orden. 


El proceso consta de cuatro etapas: se obtienen fórmulas con todos los 
cuantificadores al principio de cada fórmula (formas prenex), se obtienen fórmulas 
sin cuantificadores existenciales (formas de Skolem), se obtienen fórmulas sin 
cuantificadores universales y finalmente se obtiene un conjunto de fórmulas en 
forma clausal: fórmulas atómicas combinadas únicamente con los símbolos lógicos 
de negación y disyunción como definimos en su momento y recordamos a 
continuación. 


En 1.5.3 presentamos las siguientes definiciones. Se llama literal a una 
fórmula atómica o la negación de una fórmula atómica. Una fórmula atómica se 
dice que es un literal positivo y la negación de una fórmula atómica un literal 
negativo. 


Si L; son literales, una cláusula es una fórmula de la forma L, v L2 V ...v Lx 
Para la presentación del sistema de resolución es más cómodo representar las 
cláusulas como conjuntos de literales {L), Lo, ..., Lx} y así lo haremos en adelante 
cuando parezca conveniente. Nótese que la consideración de las cláusulas como 
conjuntos nos autoriza a eliminar los literales repetidos sin que ello afecte a la 
satisfacibilidad o insatisfacibilidad. Una cláusula de Horn es la que tiene a lo 
sumo un literal positivo y es afirmativa cuando tiene exactamente un literal 
positivo y negativa cuando sólo consta de literales negativos. 


2.1.1 Formas Prenex 


Definición 1. Forma prenex 


Una fórmula, A, de un lenguaje de primer orden se dice que está en forma 
prenex si A es de la forma Q;x; Q2Xx2 ... QnX, B donde Q; son los símbolos Vo 3, x; 
son variables distintas y B es una fórmula sin cuantificadores, la “matriz de la 
fórmula” A. 
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Definición 2. Operaciones prenex 


Se llaman operaciones prenex las que consisten en reemplazar una parte 
de una fórmula, A, por otra subfórmula de alguna de las formas siguientes, donde 
O’es VsiQes Fy QO’ es Jsi Qes V: 


a) 3x B por 3y B,[y] (variante de 3x B), y no libre en B 
b) =Qx B por Q'x-B 

c) Qx B v C por Qx (B v C), six no libre en C 

d) B v Qx C por Qx (B v C), si x no libre en B 

e) QxB>C por Q'x (B >C), si x no libre en C 

f) B > QxC por Qx (B >C), si x no libre en B 

g) QxB 4 C por Qx (B a C), si x no libre en C 

h) B a Qx C por Qx(B 1 C), si x no libre en B. 


Aunque a) no es propiamente una operación prenex (no varía la posición de 
los cuantificadores), se incluye en esta lista porque en muchas ocasiones es 
necesaria para asegurar la condición de que la variable sobre la que va a actuar una 
operación sea libre. Es una operación que, aplicada reiteradamente, permite que las 
variables cuantificadas se puedan renombrar, con tal de que el nuevo nombre no 
estuviera ya en la fórmula cuantificada. En el presente contexto su objetivo es 
conseguir que las variables libres de una fórmula no coincidan con las 
cuantificadas y, de esta forma, asegurar la mencionada condición de la variable 
sobre la que se está trabajando, como puede verse en los ejemplos más abajo. Más 
adelante veremos que renombrar variables permite, en algunos casos, sustituciones 
que no serían posibles de otra forma y que son igualmente importantes. 


Teorema 1. Equivalencia lógica con la forma Prenex 


Si A’ resulta de A por aplicación de una operación prenex, entonces A’ es 
lógicamente equivalente a A. 


Recuérdese que la equivalencia lógica se define como la conjunción de que 
A es consecuencia lógica de A” y su recíproco. En otras palabras, A y A” son 
válidas, o no válidas, en exactamente las mismas estructuras y, por tanto, la 
satisfacibilidad de una cualquiera implica la de la otra. Utilizaremos la notación A 
= A’ para indicar que A y A” son lógicamente equivalentes. El teorema se 
demuestra como una consecuencia de los ejercicios 1 y 2 a continuación. 


Ejercicio 1. Demuéstrese que cada operación a)-h) aplicada a una fórmula 
F proporciona una fórmula lógicamente equivalente a F. 
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Ejercicio 2. Demuéstrese que si A” es la fórmula obtenida de A 
reemplazando una subfórmula B por B” y B es lógicamente equivalente a B” 
entonces A es lógicamente equivalente a A’. 


Ambos ejercicios son sencillas aplicaciones de la definición de validez en 
una estructura. 


Teorema 2. Conversión a forma prenex 


Para toda fórmula A de un lenguaje de primer orden existe una fórmula A’ 
en forma prenex y que es lógicamente equivalente a A (A = A’) 


La demostración se hace por inducción sobre fórmulas (la definición 
inductiva de fórmula está en 1.1.1, Definición 3) y no es más que la formalización 
de que, por aplicación repetida y finita de operaciones prenex, toda fórmula se 
puede convertir en otra que esté en forma prenex y sea lógicamente equivalente, 
por la equivalencia lógica asegurada para cada paso por el teorema anterior. 


Debería ser claro, por la definición de fórmula, que las operaciones e)-h) se 
incluyen por comodidad, pero no son necesarias para demostrar el teorema. Si en 
una fórmula apareciese la conectiva doble implicación se sustituiría por su 
definición como conjunción de implicaciones. 


Ejemplo 1. Sea la fórmula Vx px > qt v St rt, con p, q y r símbolos de 
predicado unoario. A la derecha de cada nueva fórmula aparece el nombre de la 
operación mediante la que se ha obtenido 


3x (px > (q tv 3trt)) e) 
3x (px > (qt v 3y ry)) a) (para que t no esté libre en qt) 
3x (px > 3y (qt v 1y)) d) 
3x Jy (px > (qt v ry)) 1) 


Ejemplo 2. Con el lenguaje de la aritmética de los números naturales, 
ejemplos 2 y 3, 1.1.1, dada la fórmula 3x (x < y An dx (z =x + y)) > V y (y<sz) 
viz(z= x+ y) se obtiene 

AX) (xı <y a~ X (z =x + y)) > Yx; (X; <s Z) v 7 x4 (x4 = x +y) a) 


V xı (x) <y amn E x (Z =x: +y) > Vx; (x; <s z) v I x4 (x4 = x +y)) e) 
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V x1 (1 <y ATA x (Z= Xp + y) > Vx; I x4 (x; <s z) v (X4= x +y))) 0) y d) 
Vx) Vx; 7 x4 (1 <y AV xo (Z =x + y) > (x; <s z) v (x4= x+y)) b)yf) 
V xi Vx; Jx (Y x ((X1 <y A (Z=x2 + y) > ((%3 <s z) v (x4= x +y))) h) 
V xı Vx; 3 x4 3x: (X1 <y A (Z =x + y) > ((x; <s z) v (x4 = x +y))) e) 


2.1.2 Formas de Skolem 


Se trata ahora de eliminar los cuantificadores existenciales de las fórmulas 
en forma prenex. El trasfondo del procedimiento es bastante natural aunque los 
detalles sean algo complicados. Si se va a eliminar 3x de 3x A(x) parece adecuado 
escribir A(a) con a un término específico. En el caso más sencillo, se reemplaza la 
variable que estaba cuantificada existencialmente por una constante que no figure 
en la fórmula que estamos tratando. En general, parece adecuado que a sea una 
función de la variable o variables que restringían a x, es decir, las cuantificadas 
universalmente antes, a la izquierda, de la cuantificación 3x de x. 


Definición 1. Forma de Skolem 


Sea A una fórmula en forma prenex. Se llama forma de Skolem de A, y se 
escribe A%, a la fórmula que se obtiene suprimiendo ordenadamente (de izquierda 
a derecha) cada cuantificador 3; al tiempo que se reemplaza en la matriz de la 
fórmula la x; cuantificada con 3 por f; (xin, Xi2, ..., Xx), donde f; es un símbolo de 
función nuevo y Xii, Xi2, ..., Xx las variables cuantificadas con Ven A y tales que 
todos los cuantificadores Vx preceden a Xx; 


(Nótese que, si no hay cuantificadores universales antes de 3x;, k es cero y 
fi es una constante, una función cero-aria.) A veces se llama función de Skolem a 
cualquiera de las introducidas en la definición anterior. 


Ejemplos 1 


La forma de Skolem de Vx dy (p x > —(r y > ~q x y)) es bx (px > 
rfs > q x fx). 


La forma de Skolem de 3x px es pa. 
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Teorema 1. (Skolem) 


Sea A una fórmula de un lenguaje de primer orden en forma prenex. A 
tiene un modelo M con universo |M] si y sólo si A tiene un modelo con el mismo 
universo. 


Demostración. Sin pérdida de generalidad, por el Ejercicio 1 de 1.3.3, que 
es una versión semántica de la regla del cierre, podemos suponer que A es cerrada. 
Probaremos que después de cada supresión de un cuantificador Sx; según la 
definición, la fórmula obtenida tiene un modelo M con universo |M| si y sólo si la 
fórmula previa tiene un modelo con el mismo universo. 


Sea, pues, la fórmula B: Vx¡Vx> ... Vx; dx C de la que, por supresión de 3x 
se obtiene B’: Vx; VX ...Vxx Cy [f(xi, X2 ...xx)]. Escribamos C, [f(xi, X2 ...xx)] de 
forma algo más transparente como C (f(x), X2 ...Xx), Xi, X2 ...Xx) para poner de 
manifiesto que f(x), X2 ...xx) ocupa el lugar de la estancia de x y que, posiblemente, 
en C también hay sendas estancias da las variables xı, x2 ...Xx. Con esta escritura, 
B’ será Vx; VX2 ...VXk C(f(X1, X2 ...Xx), X1, X2 -.X1). 


Si hay un modelo M para B’, M(B’) será V, es decir, M(C (f(c¡, C2 ...Cx), 
Cj, Co ...Cx)) será V para cada tupla (cı, c» ...cx) de nombres de individuos 
cualesquiera de M. Dada dicha tupla arbitraria, sea c el nombre del individuo 
fu(M(c1), M(c2 ), ...M(cx)) de forma que M(c) y M(f(ci, C2, ... Cx)) sean este mismo 
individuo. No es dificil demostrar que la igualdad de significado de c y f(c;,C2,..., 
cx) se traslada a las fórmulas donde aparecen y, por tanto, M(C (c, C1, C2 ...Cx)) es 
también V con c1, C2 ...cx nombres arbitrarios y c un nombre. Según la definición 
de significado de verdad en M para una fórmula como B, eso quiere decir que 
M(B) es V y M es un modelo para B. 


Supongamos ahora que hay un modelo M para B. Entonces M(B) es V y 
e) M(C (c, c1, C2 ...Cx)) 


es también V con cj, C2 ...c, nombres arbitrarios y c un nombre de individuo que 
existe una vez elegidos C1, C2 ...cx. Esto permite definir una función fm, que en 
general no estaría previamente definida en M, tomando para cada tupla (pı, p2 
..«px) € [MI los nombres (ci, c2 ...cx) de sus elementos, escogiendo uno de los 
nombres, c, que se obtienen arriba para la tupla (cı, c2 ...cx), llamando p al 
individuo cuyo nombre es c: M(c) = p y escribiendo 


fu(Pi, Pa ---Pk) =P V (Pi, P2 ---Px) € IMË. 
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Sea M’ la estructura obtenida por ampliación de M con la función fy y 
haciendo corresponder dicha función al símbolo de función f introducido en B”. M’ 
es una estructura para el lenguaje de B” y es un modelo para B’ pues la constante c 
de (*) es el nombre del individuo definido por fu(p;, p2 ...px) y el significado V en 
M de (*) implica que 


M(C (Rci, C2 ...Ck), C1, C2 ...Cx)) 
es V para cada tupla (cı, cz ...cx) de nombres de individuos cualesquiera de M’. 
Según la definición de significado de verdad en M’ para una fórmula como B’, eso 
quiere decir que M’(B’) es V y M’ es un modelo para B’. n 


Ejemplo 2. 


Sea la fórmula Vz (3 x (z = 2x) > 3 x (z? = 2x)). Pasaremos primero a 
forma prenex 


VzQGx(z=2x)>1 y (22 = 2y)) Operación a) 
VzVWx((2=2x)>1y (22 =2y)) e) 
V zV x dy ((z = 2x) > (22 = 2y)) 1 


y después a forma Skolem 


VzZVx((2=2x) > (2? =2f(z, x))) 


2.1.3 Supresión de cuantificadores universales 


Teorema 1 


Sea A = (A, A), ..., An} un conjunto de fórmulas en forma de Skolem y sea 
B = [B, B2 ..., B, } el conjunto de las fórmulas obtenidas de ellas al suprimir todos 
los cuantificadores universales. A es satisfacible si y sólo si B lo es. 


Demostración. Si llamamos A,’ al cierre de A; y A; es de la forma Vx; Vx» 
... VX, Bi, Aj‘ es también el cierre de B; o lógicamente equivalente a dicho cierre. 
Pero entonces, por el Ejercicio 1 de 1.3.3, versión semántica de la regla del cierre, 
las estructuras donde son válidas las fórmulas A; son exactamente las mismas que 
las que hacen válidas a B; y, por tanto, la satisfacibilidad de (Aj, Ao, ..., An} 
equivale a la de (B,, Bo, ..., Ba}. = 
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Ejemplo 1. Los números naturales, N con el número 0, la suma ordinaria 
+y, la función — (el opuesto de) y el resto de funciones y predicados habituales, son 
un modelo para la fórmula Vy(y + f y = 0). Esto significa que esa fórmula, cerrada, 
tiene el valor V en N, en otras palabras, que para todo número natural e, e +y (-e) = 
0. Pero eso es lo mismo que decir que todas las N-instancias de y + f y = 0 tienen el 
valor V, o sea que N es un modelo de y + fy =0. 


2.1.4 Reducción a un conjunto de cláusulas 


Teorema 1. Forma normal conjuntiva 


Toda fórmula de un lenguaje de primer orden que no contenga 
cuantificadores es lógicamente equivalente a un conjunto finito de formulas del 
tipo Aj; VA V V Ain V Ay V Ay Y... Y AA jn donde Air, Ajs son fórmulas 
atómicas. 


Recuérdese que a las fórmulas de la forma anterior se les llama cláusulas, a 
su conjunción forma normal conjuntiva y a las A i, ~A js literales, positivos y 
negativos. El caso proposicional se vio en el Ejercicio 1 de 1.5.3. 


La demostración es formalmente análoga a la del teorema 2 de 2.1.1 
usando las equivalencias lógicas que se relacionan a continuación, en lugar de las 
producidas allí por las operaciones prenex, junto con la asociatividad de las 
disyunciones y conjunciones. 


A>B=-A vB definición > 
ASB=(AAB)vVEA»A=B) definición + 
—A=A 

=(A v B)= (~A AB) leyes de De Morgan 


— (AAB) = (HAv=B) 
Av(BAC)=(AvB)A(AvC) distributividad 
A A(BvC)=(AAB) v (AAC) 
Ay AA? A..-AAn ={A1, Ad ..., An} 
Notese que todas las anteriores son equivalencias tautológicas (Ejercicio 4 de 


1.1.3) y además, por los teoremas de tautología y completud, equivalencias lógicas. 


La inducción es ahora más sencilla al no haber fórmulas de la forma 3xB y, 
de nuevo, no es más que la formalización de que, por aplicación repetida y finita de 
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las equivalencias anteriores, toda formula sin cuantificadores se puede convertir en 
otra lógicamente equivalente, en virtud de las mencionadas equivalencias, y que 
esté en forma clausal. 


Teorema 2. Resumen 


Todo conjunto de fórmulas de un lenguaje de primer orden es satisfacible 
(o insatisfacible) si y sólo si lo es el conjunto de cláusulas resultante de, 
sucesivamente, pasarlo a forma Prenex, pasarlo a su forma de Skolem, eliminar 
los cuantificadores universales y reducirlo a un conjunto de cláusulas, según se ha 
definido en las secciones previas. 


Aunque las cláusulas puedan parecer expresiones de una versión muy 
simplificada de los lenguajes de primer orden, no lo son en el sentido expresado 
por este teorema. Su demostración no consiste más que en encadenar los cuatro 
pasos que acabamos de describir, junto con los distintos resultados de equivalencia 
en cada caso. Se trata de una equivalencia más débil que la equivalencia lógica, 
pero que es suficiente para nuestro propósito. 


Ejemplo 1. Si partimos de la siguiente fórmula (VxVWy—A(x,y)AB(x,y)) v 
3x3yC(x,y), obtenemos sucesivamente: 


((Vx1 Y x2 =A(X¡, X2) A B(x,y)) Y 3 x3 3 x4C(x3, X4) 

Vx, V x2 (A(x, X2) A B(x,y)) v 3 x; 3 x4C(X%3, X4) 

Vx, V x23x3 F x4 (“mA (xı, X2) A B(x,y)) v C(x, X4)) forma Prenex 
Vx, V x2 J x4 (A(X), X2) A BX y)) v C(f(X1, X2), X4)) 

Vx1 V x2 ((7A(x;, X2) A B(x,y)) Y C(K(x1, X2), 2(X1, X2))) forma de Skolem 
(~A (xı, X2) AB(Xy)) v C(f(x1,X2), g(X1,Xx2)) fórmula sin cuantificadores 
(Axı, X2) Y C(£(X1, X2), g(X1, X2))) A (BEY) Y C(f(X1, x2), g(X1, X2)) 
{(AA(X1,X2) V C(K(x1,X2),8(%1,X2))), (B(x,y)VC(K(x1,X2),8(X1,X2))) cláusulas. 


Ejemplo 2. Si la fórmula inicial estuviera ya sin cuantificadores, como en 
el siguiente ejemplo (Ay VA; > A2) A (Ay O Az), obtendríamos sucesivamente: 


(=(Ao VA1) v Az) A (Ao a AB) v (Ao n= As) definiciones > y e 


(Ao AA) v Az) a ((Ao ^ A3) v (=A ^ = Ag)) De Morgan 
(Ao v A2 )A( As v A2)) A (((Ao A As) v Ao) ^ ((Ao ^ Ag) v — Ag) 
distributividad 


((HAo v A2 )a( ~A; v Az)) ^ (((Ao V Ao) ^ (As v =Ag)) A ((Ao v Az) A 
(As v = Ag))) distributividad 
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(Ao v A2 )A( Ay v A2) A (Ao v Ao) ^ (As v Ao) A (Ao v Ag) A 


(Az v — Ag) 
asociatividad 
(Ao v Az , ~A; v Az, Ao V Ao, As v Ao, Ao V As, Az v — Az) 
cláusulas. 


Aunque de momento no haremos hincapié en este hecho, nótese que las 
tautologías del conjunto de cláusulas se pueden suprimir sin perder la equivalencia, 
en el sentido de satisfacibilidad: si el conjunto 


{Ap V Az, =A; V Az, Az V=Ao, Ao V nA; } 


es satisfacible también lo es el anterior pues las fórmulas extra, tautologías, 
siempre lo son. La implicación recíproca es inmediata. 


Nótese también que, para un conjunto de partida dado, no hay un único 
conjunto de cláusulas equivalente en el sentido de la satisfacibilidad, debido a que 
se pueden usar cambios en el orden de aplicación de las operaciones que componen 
los sucesivos pasos para, por ejemplo, reducir el número de argumentos de las 
funciones de Skolem. En este lugar no nos extenderemos más en tales cuestiones 
de eficiencia. 


2.2 UNIFICACIÓN 


Dado que la idea de la resolución es “cancelar” literales que aparecen como 
positivos, p, en una fórmula y negativos, —p, en otra, es necesario disponer de un 
proceso que haga coincidir los términos que aparecen en p en la primera fórmula 
con los que figuran en la segunda. Debe ser claro que, en general y sin cambiar 
nada, no se da dicha coincidencia. Si las dos fórmulas son 


Av paja)... an y Bv —p bı bp... bn 


con p un símbolo de predicado n-ario y a; y bj términos, no podremos cancelar pa; 
a... an y ~p bi bz... bn a menos que se sustituyan adecuadamente algunas 
variables de a; y bj . Esta idea de hacer coincidir átomos es la que ahora vamos a 
exponer con precisión, es el primer paso en el camino hacia la resolución y aparece 
en más de una parcela de la demostración automática. 


Definición 1. Sustituciones 


Dada una fórmula A de un lenguaje de primer orden ya hemos definido 
A,[t] para representar la fórmula obtenida de A al sustituir todas las estancias libres 
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de x por el término t, siempre que x sea sustituible por t. Ahora, vamos a 
reconsiderar la operación que acabamos de recordar y definirla como un objeto 
independiente que aplica fórmulas en fórmulas y que puede componerse con otros 
objetos semejantes. 


Definimos una sustitución como una aplicación del conjunto de fórmulas 
de un lenguaje de primer orden en sí mismo, que se denota por un conjunto 
ordenado finito de pares (x/t) en los que se asocia una variable x a un término t, y 
que aplica las fórmulas como se describe a continuación. Cada par (x/t), que a 
veces se llama componente de la sustitución, actúa sobre una fórmula A en la 
forma acostumbrada: 


(x/)A = A,[t] 


y la imagen de una sustitución cualquiera f(x, /ty )(x2 /t2)... (xs/t, )} aplicada a una 
formula A se calcula en la forma habitual de composición de funciones 


¿(1 /11) (x2 t) ~- (xx ltu JA = (1/41) ((X2/t2 )(-- (Xe /tk) AY) ~). 


Naturalmente la imagen de un conjunto de fórmulas por una sustitución no 
es más que el conjunto de las imágenes de las fórmulas: a{Aj, A2 ...} = {0A;, 
a.A»...). 


Nótese que, en un abuso de notación, estamos utilizando el símbolo = 
como la identidad real de fórmulas y así seguiremos usándolo en el resto del 
capítulo. 


Si, por ejemplo, p es un símbolo de predicado 3-ario, f un símbolo de 
función unoaria y a y b constantes 


{(x /a ) (y /1b) (z /y )}pxyz es pafbfb. 


La composición de sustituciones es la obtenida por la concatenación 
ordenada en un sólo conjunto de los elementos de los conjuntos que las definen y 
no es, obviamente, conmutativa. 


Definición 2. Unificación 
Se dice que un conjunto {Aj A2 ..., An} de fórmulas de un lenguaje de 


primer orden es unificable si y sólo si existe una sustitución o tal que aplica todas 
las fórmulas en la misma, es decir, 
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CÁA¡=04A>= .. =O0Án 


Una sustitución o así definida se dice que es un unificador de (A, A2 ..., 
An}. 


Por ejemplo, la sustitución {(x/a) (y/b) (z/c)} unifica las fórmulas pxbz y 
payz pues 


{(x/a) (y/b) (z/c)} pxbz = {(x/a) (y/b) (z/c)} payz = pabe. 


Parece claro en el ejemplo anterior que otras sustituciones también serian 
unificadores de pxbz y payz. De hecho, lo que se haga con z no cambia el que la 
sustitución sea un unificador: se puede sustituir por constantes o por otros símbolos 
de función con o sin variables. Por ejemplo podríamos poner la componente (z/ fv) 
o bien (z/fa). La primera parece más general que la segunda puesto que no cierra la 
estancia de z a posteriores sustituciones, ya que seguimos disponiendo de la 
variable libre v. Esto, que es deseable para el uso de la resolución, es el objeto de 
la siguiente definición. 


Se dice que o es un unificador de máxima generalidad del conjunto I = 
[Ay A2 ..., An} de fórmulas si para cada unificador a de T existe una sustitución B 
tal que a = Bo. 


Por ejemplo, (x/a) es un unificador de maxima generalidad para las 
fórmulas payz y pxyz y el unificador de las dos mismas fórmulas, {(x/a) (y/b) 
(z/c)), se obtiene por la composición 


{(x/a) (y/b) (2/c)) = {(y/b) (2/0); {(x/a)} 
Nota 1. Unificación sólo para literales 


Para el desarrollo que va a seguir, no necesitamos ocuparnos más que de la 
unificación de cláusulas y en particular de literales. Lo que realmente se usa para 
verificar la insatisfacibilidad de cláusulas es cierta combinación generalizada de la 
regla de corte con la unificación para la cual necesitamos pares de literales 
“complementarios”, L y ~L. Asi, parece que deberíamos centrarnos en aquellas 
sustituciones que generen literales complementarios. Aunque la idea es clara una 
vez formulada y el concepto de unificación se remonta a Herbrand en 1930, no se 
explotó al principio de los procedimientos de demostración automática y hubo que 
esperar a los años 60 en los que Prawitz y posteriormente John Alan Robinson 
introdujeron la unificación, el unificador de máxima generalidad y la resolución. 
En palabras de Robinson “Mirando hacia atrás, la unificación y la resolución 
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parecen ideas bastante obvias cuando uno se pregunta por lo que tiene que ser 
sintacticamente cierto en un conjunto de cláusulas con la propiedad semántica de 
no tener ningún modelo...” (Robinson, 1996). 


En el espíritu de las consideraciones precedentes, vamos a presentar el 
teorema de Robinson (Robinson, 1979) donde se demuestra constructivamente la 
existencia de un unificador de máxima generalidad para cualquier par de fórmulas 
atómicas, en adelante átomos. El teorema general de Robinson se aplica a pares de 
expresiones cualesquiera, el resultado más particular que aquí exponemos basta 
para la utilización que vamos a hacer del mismo. 


Se utilizará la notación {} para indicar la sustitución identidad o vacía, 
que aplica cada fórmula en sí misma. 


Teorema 1. Teorema de unificación de Robinson 


Sean A y B dos átomos. El conjunto S = {A,B} es unificable si y sólo si el 
Algoritmo de Unificación (véase más abajo) así lo indica al terminar. La 
sustitución que proporciona el algoritmo en ese caso es un unificador de máxima 
generalidad de S. 


Antes de entrar en la demostración del teorema, haremos una descripción 
informal, veremos la definición del algoritmo y algunas consideraciones sobre el 
mismo. 


El Algoritmo de Unificación termina siempre y puede hacerlo de dos 
formas o bien diciendo que el conjunto S no es unificable o con la afirmación de 
que S es unificable y proporcionando un unificador de máxima generalidad para el 
mismo. El proceso consiste en la generación de una sucesión finita de pares (S;, s;) 
en los que S; es a su vez un par de átomos y s; una sustitución. Cada par está 
relacionado con el precedente por las ecuaciones 


Sis =m; S; 
Si+1 = MiS; 


donde So es S, so es {} y m; es una sustitución (x;/t;) con t un término que no 
contiene a la variable x. Tanto x como t se toman de entre las variables y los 
términos de S con lo que la aplicación de m disminuye el número de variables de S 
exactamente en una unidad, por lo que la sucesión (Sj, si) no sólo es finita sino que 
el número de sus elementos está acotado por el número de variables en S. 
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Se comprueba inmediatamente que S; = siS y, por tanto S; = {sjA,s;B}. 
Cuando s;A = s;B terminamos indicando que S es unificable y s; un unificador de 
máxima generalidad de S. 


Cuando no es ése el caso debemos analizar en qué se diferencian s;A y s¡B. 
Notemos primero que, para dos átomos cualesquiera pa; az ... ax y qbibz ... bm, O 
bien p y q son distintos, con lo cual la unificación es imposible, o, si no, tienen el 
mismo número de términos k =m. Entonces, parece adecuado comenzar el análisis 
de las diferencias entre s;A y siB definiendo la función diferencia de dos átomos A 
y B cualesquiera. 


Definición 3. Diferencia de dos átomos 


La función dif(A,B) se define como la aplicación que se calcula como 
sigue: 


e siA=B, dif(A,B) es el conjunto vacío 


e si A AB, se leen A y B de izquierda a derecha hasta encontrar la 
primera posición donde los correspondientes símbolos son 
distintos; sean tı y tz dichos símbolos o los términos de, 
respectivamente, A y B que, en su caso, comienzan en ellos; se 
define 


dif(A,B) = (t,t) 
Definición 4. Diferencia negociable 


Definimos que dif(A,B) = (t,t) es negociable si verifica las tres 
condiciones siguientes: no es el conjunto vacio, al menos una de las dos 
expresiones t; y t, es una variable y ninguna de las dos forma parte de la otra. 


Nótese que las expresiones t; pueden ser los símbolos iniciales de 
predicado de los átomos y, para A # B, son distintos, la diferencia no es negociable 
(ninguno es una variable) ni los átomos unificables. 


Si, por ejemplo, A= pxfy B = pzgu la primera dif(A,B) = (x,z) es 
negociable y podemos definir sı = (x/z) o bien sı = (z/x) con lo que dif(s¡A,s¡B) = 
dif(pzfy,pzgu) = (fy,gu) que no es negociable poniendo de manifiesto que A y B 
no son unificables. Hemos utilizado la sustitución sı = (x/z) y no sı = (z/x) porque 
las dos expresiones que forman la diferencia son variables y, como veremos, en 
este caso no importa cuál de las dos sustituciones se use. Si hubieran sido A= pxfy 
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B = pzu, la primera diferencia sería la misma y la segunda dif(s¡A,s¡B) = 
dif(pzfy,pzu) = (fy,u) que es negociable, permite definir s, = (u/fy)(x/z) con lo que 
S.A = pzfy = s2B y A y B son unificables. 


Las sustituciones (x;/t;) que se pueden aplicar cuando la dif(s;A,s;B) es 
negociable se llaman reducciones de la dif(s;A,s;B) y, como dijimos y de acuerdo 
con su nombre, después de aplicar una de ellas se reduce en uno el número de 
variables del conjunto S = {A,B}. 


Con todo lo dicho el Algoritmo de Unificación se puede expresar 
sencillamente así: 


Unificar (A,B) 
s=f} 


mientras dif(sA,sB) sea negociable 
s:= ms, donde m es cualquier reducción de dif(sA,sB) 
si dif(sA,sB) es el conjunto vacio 


entonces escribir “hay un unificador s de maxima 
generalidad de A y B” y detenerse 


sino, A:=mA, B:=mB 


escribir “A y B no son unificables” y detenerse. 


Demostración del teorema de unificación. Primera parte, corrección: si 
el Algoritmo de Unificación termina y escribe que el conjunto S = {A,B} es 
unificable, entonces {A,B} es unificable. 


Nótese que se elimina una variable de {A,B} en cada paso de la iteración 
mientras. Por tanto y en cualquier caso, al cabo de un número finito de iteraciones, 
o bien dif(sA,sB) es vacío o no quedan variables en {sA,sB} con lo que dif(sA,sB) 
no es negociable, se sale de la iteración y el algoritmo termina (termina siempre). 
Si escribe que hay un unificador es porque dif(sA,sB) es vacío, es decir, sA = sB y 
por tanto A y B son unificables. Esto demuestra la parte si (condición suficiente) 
del teorema, es decir, su corrección. 


Para demostrar el sólo si del teorema, usaremos los siguientes Lema y 
Corolario, que se sigue inmediatamente del Lema. 
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Lema 1 


Si A y B son unificables, en todos los pasos del algoritmo (que, recuérdese, 
se caracterizan por la sustitución s que acompaña a A y B) se verifica que si u es 
un unificador de A y B, u = us. 


Corolario 1 


Si u es un unificador de A y B, u unifica (sA, sB), siendo s la sustitución 
correspondiente a cualquier paso del algoritmo. 


Demostración del Lema 1. Haremos una inducción sobre los pasos 
(asignación s:= ms) de la iteración “mientras”. Antes del primer paso, la afirmación 
del Lema es inmediata pues ses {} yu=u{}. 


Supongamos que el lema es cierto antes de un paso en el que se selecciona 
una reducción m = (x/t) de dif(sA,sB) = (x,t) con x una variable que no aparece en 
t. Para cualquier unificador u de A y B, que, por hipótesis de inducción (u = us), 
también lo es de sA y sB (u(sA)=us(A)=uA=uB=us(B)=u(sB)), um = u. En efecto, 
la igualdad anterior se demuestra comprobando que el efecto de um y el de u es el 
mismo sobre todas las variables. Si la variable es x 


umx = u(mx) = ut = ux, pues u unifica sA y sB y también dif(sA,sB) = (x/t). 
Si la variable no es x, por ejemplo y, 
umy = u(my) = uy. 


Queda, pues, demostrado que um = u. Si s es la sustitución antes del paso en que se 
seleccionó m, u = us, por hipótesis de inducción. Sustituyendo u por um 


u = us = ums = u(ms). 


Y, como ms es s después del paso en que se selecciona m, u = us para esta 
segunda s y esto termina la inducción. m 


Demostración de la segunda parte del teorema de unificación, 
completud 


Supongamos que A y B son unificables por la sustitución u, por ejemplo. 
El algoritmo itera el bucle mientras dif(sA,sB) sea negociable. Dif(sA,sB) sólo deja 
de ser negociable, por definición, si es vacío, o no contiene ninguna variable o 
consiste en dos expresiones una de las cuales es parte de la otra. Si, en cualquier 
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iteración del bucle, dif(sA,sB) no es igual al conjunto vacío, como, por el Corolario 
1, u unifica (sA,sB), debe existir x en, por ejemplo sA y t (que no contiene a x) en, 
por ejemplo, sB de forma que dif(sA,sB) = (x,t). Al cabo de un número finito de 
iteraciones (A y B son expresiones finitas) x será el último símbolo de sA, la nueva 
s es (x/t)s, y en la siguiente iteración dif(sA,sB) será el conjunto vacío, el algoritmo 
terminará y escribirá que hay un unificador s de máxima generalidad de A y B, lo 
cual es cierto porque el Lema 1 se aplica a todas las s y, en particular, a la última s. 
n 


2.3 RESOLUCIÓN Y TEORÍA DE HERBRAND 


Aunque no vamos a seguir en la dirección apuntada a continuación, sí 
conviene hacer notar lo siguiente: la resolución puede entenderse mejor en el 
contexto en el que nos encontramos (sistemas formales con las teorías de primer 
orden como gran ejemplo) como otro sistema formal en el que las fórmulas son las 
cláusulas de un lenguaje de primer orden, no hay axiomas y hay una sola regla, la 
resolución o “principio de resolución”. ¿Por qué es interesante un sistema tan 
limitado? Porque ya estamos centrados en un objetivo muy concreto: demostrar la 
insatisfacibilidad de un conjunto de cláusulas. No nos interesa ningún axioma y, si 
la única regla nos lleva a deducir, del modo que se verá, dicha insatisfacibilidad, 
tenemos todo cuanto necesitamos. La buena noticia es que, como veremos, la 
mencionada insatisfacibilidad de un conjunto de cláusulas equivale a la deducción 
de la cláusula vacía en el sistema de resolución. 


2.3.1 Principio de resolución 


Las deducciones en resolución se hacen por obtención secuencial de 
resolventes según se define a continuación y mediante la regla que también se 
incluye en la misma definición. La idea de fondo, no los detalles, es muy sencilla y 
ya estaba en la regla de corte de las teorías de primer orden. Hablando 
semánticamente, si A es verdadero o B es verdadero y si también ocurre que A es 
falso o C es verdadero, podemos inferir que B es verdadero o C es verdadero. La 
generalización y formalización adecuada es la que sigue. Recuérdese que 
consideramos las cláusulas como conjuntos de literales. 


Definición 1. Resolvente 


Se dice que R es la resolvente de C, y C; siendo C,, C) y R cláusulas, si 
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i) se pueden obtener cláusulas sin variables en común a partir de C, y C2 por 
la aplicación de sendas sustituciones s1 y S2 que no consisten más que en 
cambios de nombre. 

ii) hay dos literales L de s,C, y AL’ de s2C2 tales que el conjunto {L, L’} es 
unificable. 

iii) R es s((s¡Cy- L) U(s2C2 - aL’) 

) donde s es un unificador de maxima generalidad de {L, L’}. 


Definición 2. Deducción por resolución 


Una deducción por resolución de la cláusula C a partir de cierto conjunto 
de cláusulas T es una sucesión de cláusulas que termina en C y tal que cada 
elemento de la sucesión es una cláusula de F o la resolvente de dos cláusulas 
anteriores. (Nótese el paralelismo con la definición de demostración en teorías de 
primer orden.) 


¿Qué mayor complejidad se ha añadido a la idea informal del principio? 
Cambios de nombres de variables para poder aplicar sustituciones que actúen 
independientemente en C; y C>. Identificación de los literales que estén “repetidos” 
en el sentido de que se pueden unificar, e identificación también de los que sean, 
salvo una sustitución, complementarios. El resto es la idea intuitiva original. 
Obviamente, para el objetivo perseguido por los cambios de nombre s; y s2, basta 
con aplicarlos a las variables de una sola cláusula, es decir, sı, por ejemplo, puede 
ser {}. 


Como repetidamente venimos diciendo, el propósito que guía el estudio de 
la resolución es la demostración de la insatisfacibilidad de un conjunto de 
cláusulas. Cuando es ése el caso, se puede deducir una inconsistencia por medio de 
la resolución. De hecho, la inconsistencia obtenida es la cláusula vacía que 
indicaremos con el símbolo O. Todo esto quedará precisado en los teoremas de 
corrección y completud que se estudiarán más adelante. 


Definición 3. Refutación 


Llamaremos una refutación en resolución al proceso que tras haber 
negado el cierre del teorema que se quiere probar y el paso a forma clausal, 
empieza una deducción por resolución a partir de dicho conjunto de cláusulas y 
termina con la deducción de |. Se llama objetivo a la formula que ha de ser 
demostrada y cláusulas objetivo a las resultantes de la conversión de su negación 
en cláusulas. 
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La resolución más sencilla es la que se aplica a cláusulas de un lenguaje 
proposicional (sólo con símbolos de predicado 0-ario). Salvo momentos concretos, 
esta exposición va a seguir con el caso general, pero debe recordarse que la 
resolución proposicional admite un tratamiento extenso, interesante y que, en 
ciertos puntos, no podremos obviar. 


Por ejemplo, si A, B y C son proposiciones, podemos deducir la cláusula 
vacía a partir del conjunto de cláusulas T = ((AJ (A, B}{—B, CH-CY 


1.A enP 

2.A,B enT 

3 =B/€ en P 

4. =C enl 

5.B resolvente de 1 y 2 

6. —B resolvente de 3 y 4 

TE resolvente de 5 y 6, cláusula vacía 


Obviamente, no han sido necesarios todos los detalles referentes a sustitu- 
ciones. 


Todavía dentro de una considerable sencillez, podemos considerar ya el 
problema general de la demostración de teoremas por medio de la resolución 
ilustrándolo con los siguientes ejemplos. 


Ejemplo 1. Una refutación 


Nos preguntamos si ocurre o no que una determinada fórmula se deduce de 
otras. Supongamos, como axiomas, que David es el padre de Manuel, David es el 
padre de Antonio y que son hijos de alguien aquellos cuyo padre es ese alguien: 
P(d,m), P(d,a), VxVy(P(x,y) > H(y,x)); y que queremos saber si, por tanto, 
Antonio es hijo de David, H(a,d). Se trata de demostrar la insatisfacibilidad de 
{P(d,m), P(d,a), VxVy(P(x,y) >H(y,x)), H(a,d)) que, reducido a cláusulas es F = 
{P(d,m), P(d,a), {AP(x,y), H(y,x)), H(a,d)), y tenemos 


1. P(d,a) oe senile 
2. —P(x.y), H(y,x) enT 
3. =H(a,d) enT 
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4. H(a,d) resolvente de 1 y 2, con la sustitución {(y/a)(x/d)} 
a. Es resolvente de 3 y 4. 


Como hemos anunciado, veremos que la deducción de la cláusula vacía 
implica la insatisfacibilidad de T y, en consecuencia, que la fórmula negada es un 
teorema. Es una prueba por refutación. 


El ejemplo precedente pudiera parecer una “generación de respuestas” que 
más tarde vamos a estudiar. No es ése el sentido del término sino algo más 
específico. Además de preguntarnos si una fórmula se deduce o no de otras, se trata 
de saber para qué individuo o individuos lo hace. 


Ejemplo 2. Refutación para una fórmula cuantificada existencialmente 


Si, con los axiomas anteriores, nos preguntamos: ¿quién es hijo de David? 
estamos planteando si ahora la fórmula 3xH(x,d) es un teorema de la teoría con los 
referidos tres axiomas y, además, qué objeto u objetos (lo más apropiado sería 
decir “constantes”) hacen que se concluya esa existencia. El cuantificador 
existencial es la pregunta típica para generar respuestas y da lugar, al pasar a la 
forma sin cuantificadores y a la clausal, a una cláusula con al menos una variable. 

(x/z)(4H(x,d)) = H(z,d) Py), H(y,x) 

Sı 


s=(x/d)(z/y) 


—P(d,y) P(d,a) 


s=(y/a) 


Figura 2.1 
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En nuestro ejemplo, el nuevo conjunto T es {P(d,m), P(d,a), {-P(x,y), 
H(y,x)}, H(x,d)) y la cláusula vacía se puede deducir como aparece en la Figura 
2.1, donde cada resolvente se coloca en la intersección de los dos trazos que se 
originan en las cláusulas de las que se obtiene (cláusulas padres). 


Hemos elegido la forma de presentar la refutación como un diagrama para 
poner de manifiesto que no sólo se infiere la cláusula vacía y, por tanto, sí se 
deduce que alguien es hijo de David, sino que las sustituciones que hay que aplicar 
para obtener correctamente las resolventes nos hacen ver que la variable de la 
interrogación, x en —H(x,d), se ha sustituido por z, z por y e y por a (el símbolo 
que se refiere a Antonio), es decir, que la respuesta generada es que Antonio es el 
hijo de David. 


(x/z)(—H(x,d)) = —H(z,d) —P(x,y), H(y,x) 
Sı 
s=(x/d)(z/y) 
—P(d,y) P(d,m) 
s=(y/m) 
o 
Figura 2.2 


Como hay otra posible deducción de la cláusula vacía (Figura 2.2), hay en 
total dos posibles respuestas, Manuel y Antonio. También podríamos habernos 
preguntado si se deducían las fórmulas H(m,d) y H(a,d) y la respuesta habría sido 
afirmativa. 


En ocasiones y en lugar de rastrear trazas o conjeturar respuestas se 
introduce el símbolo de predicado Resp (por “respuesta”) en disyunción con la 
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negación de la pregunta y con su misma variable o variables y se procede como 
sigue. 


Con el mismo ejemplo anterior, ahora escribiremos [ = {P(d,m), P(d,a), 
{=P(x,y), H(,x)), {AH(x,d), Resp(x))) y buscaremos una deducción no de la 
cláusula vacía, sino de una cláusula que contenga sólo literales Resp: 


1. P(d,m) enT 
2. P(d,a) enT 
3. Py), H(y;x) enT 
4. —H(x,d), Resp(x) enT 
5. —P(d,y), Resp(y) resolvente de 3 y 4 
6. Resp(m) resolvente de 1 y 5 
7. Resp(a) resolvente de 2 y 5 


Asi hemos obtenido las dos respuestas anteriores. Desgraciadamente la 
resolución para cláusulas de las teorías de primer orden hereda su indecidibilidad y, 
en general, no sabremos nunca si las respuestas obtenidas hasta el momento son 
todas o no. Cuando, a continuación, estudiemos más sistemáticamente el uso de la 
resolución no introduciremos en general el símbolo de predicado Resp, pero sí 
obtendremos la misma información que nos proporciona Resp guardando con cada 
resolvente las sustituciones que genera. 


2.3.2 Corrección 


Teorema 1. Corrección de la resolución 


Si hay una deducción por resolución de la cláusula vacía a partir de un 
conjunto de cláusulas T, entonces I es insatisfacible. 


Para demostrarlo basta ver que cada vez que se obtiene una resolvente 
ésta es consecuencia lógica de las cláusulas de las que se obtiene (cláusulas 
padres). 


Para ser más precisos diremos que la resolvente, como disyunción de 
literales, es consecuencia lógica de las dos disyunciones formadas por los literales 
de las cláusulas padres. En particular, la cláusula vacía que se deduce finalmente 
será consecuencia lógica de A y ~A’ para las que existe una sustitución s tal que 
sA = Ay y snA’= - Ap y que, por tanto, constituyen un conjunto insatisfacible. Por 
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una sencilla inducción sobre el número de pasos de la deducción se obtiene que T 
también debe ser insatisfacible. 


Demostremos, pues, que cada resolvente es consecuencia lógica de sus 
cláusulas padres. En efecto, sean C; y C2 las cláusulas que producen la resolvente R 
= s((s; Cı - L) U (s2 C2 - “L”)). Recordemos que s es un unificador de {L, L’} y 
llamemos Lo al literal Lo = s(L) = s(L”). Con esta notación, escribimos 


R=(s sı Cı - (Los) U (s s2 C2 - {Lo}). 


Sea M una estructura para el lenguaje en el que están escritas las cláusulas 
Cı y C2 y donde ambas son válidas. Supongamos que R no es válida en M. Como 
Cı y C eran válidas en M, las M-instancias de C; y Cz son V en M y las M- 
instancias (s sı Cı)’ y (s s2 C2)’ de ssıCı y ss2C2 son también V en M (pues las 
sustituciones no introducen ningún símbolo ajeno al lenguaje de Cı y C3): 
M(ss¡C 1)” = M( ss2C2)’ = V. Por otro lado si R no es válida en M, para alguna M- 
instancia R’ de R 


M(R’) = M(((s sı Ci Y - {L’o}) U ((s s2 C2)’ - (L*3)) =F. 


Si el significado en M de la disyunción de (s sı C, Y - {L’o} y (s s2 C2)’ - 
{AL’o} es F, M((s sı Ci Y - {L’o}) = M((s s2 C2)’ - {AL’o}) =F. Estas dos últimas 
cláusulas son iguales a (ss; Cı )’ y (ss2 C2 ) salvo por la ausencia de L’) y =L” y 
M((ss; Cı Y = M(ss2 C2 )’) = V como hemos justificado más arriba. La consecuen- 
cia, M(L’») = MEL?) = V, es contradictoria. Por tanto R es válida en M y, al ser 
M una estructura cualquiera de las que hacen válidas a C; y C2, R es consecuencia 
lógica de C; y C2. B 


Nota 1. El teorema también es cierto para la deducción de cualquier 
cláusula, aunque no sea la cláusula vacía, en el sentido de que la deducción por 
resolución de cierta C a partir de un conjunto T implica que C es consecuencia 
lógica de T, y la demostración no es diferente de la que acabamos de ver que 
prueba la corrección respecto a la insatisfacibilidad. 


Sin embargo, el método de resolución no genera todas las consecuencias 
lógicas de un conjunto de cláusulas y en ese sentido no es completo. Piénsese, por 
ejemplo, en cualquier tautología del tipo ~AvA tal que el átomo A no se encuentre 
en el conjunto original: la tautología es obviamente consecuencia de ese conjunto, 
y de cualquiera, pero nunca aparecerá en una deducción por resolución. No 
obstante, veremos que la resolución sí es completa respecto a la refutación: si 
cierto conjunto es insatisfacible se deducirá la cláusula vacía por resolución a partir 
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del mismo. En la sección siguiente exponemos las herramientas necesarias para 
obtener este resultado. 


2.3.3 Teoría de Herbrand 


En la práctica habitual, los términos y formulas sin variables (ni 
cuantificadores en el caso de las fórmulas) se llaman términos y fórmulas básicos. 
El objetivo que nos guía, la resolución y la programación lógica, hace que no 
contemplemos más fórmulas que las cláusulas y, por tanto, hablaremos de 
cláusulas básicas, sin variables, y por extensión se aplicará el adjetivo básico a 
contextos que tengan que ver con cláusulas básicas. 


Además, las cláusulas están escritas en un lenguaje sin el símbolo = de 
igualdad. Se puede estudiar toda la teoría que estamos exponiendo sin prescindir de 
la igualdad, pero requiere, en lo lógico, arrastrar consistentemente en todos los 
pasos los axiomas que caracterizan la igualdad y que presentamos en su momento. 
En lo computacional (capítulo siguiente), veremos, aunque sea brevemente, que se 
puede tratar la igualdad con predicados predefinidos en el lenguaje concreto de que 
se trate. 


Por todo lo dicho, exponemos la teoría de Herbrand para cláusulas sin 
igualdad. La teoría para fórmulas cualesquiera se puede desarrollar sin ningún 
cambio notable. 


Definición 1. Universo de Herbrand 


El universo de Herbrand de un conjunto finito de cláusulas T, U(T) es el 
conjunto de todos los términos básicos que pueden construirse con los símbolos de 
función que aparecen en T. En el caso de que I no contenga ninguna constante, se 
toma una constante arbitraria, por ejemplo a, y se aplica la definición anterior a 
los simbolos mencionados más la constante a. 


Es muy importante notar que U(T) es un conjunto real con existencia 
separada del lenguaje simbólico del que proviene. Sus elementos se escriben igual 
que los términos de dicho lenguaje, pero no son ni se van a usar como tales. Su 
entidad consiste en ser elementos del conjunto U(T), destinado a ser el universo de 
ciertas estructuras. 


Nótese también que, puesto que una función se puede aplicar cuantas veces 
se quiera, U(T) es en general infinito. Sólo cuando en el lenguaje de T no hay más 
símbolos de función que las constantes, entonces U(T) es finito. 
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Por ejemplo, para T = {{—P(fx,x), VG9, O(x,fx)}, P(fm,m), V(m), 
—0(m,fm)) con V símbolo de predicado unoario, P y O símbolos de predicado 
binarios, m una constante y f símbolo de función unoaria, U(T) es fm, fm, ffm, 
fffm, ...), mientras que si cambiamos a T = {{—P(d,x), "VG9, O(x,d)}, P(d,m), 
V(m), -0O(m,d)) con d y m constantes, U(I) sólo consta de d y m. 


Definición 2. Extensión de Herbrand 


La extensión de Herbrand E(T) de un conjunto T de cláusulas es el 
conjunto de cláusulas básicas obtenido al reemplazar todas las variables de las 
cláusulas de I por todos los elementos del universo de Herbrand de T. 


Definición 3. Estructuras de Herbrand 


Se dice que una estructura M es una estructura de Herbrand para un 
conjunto de cláusulas T, si el universo de M, |M], es el universo de Herbrand de T, 
U(T), los términos básicos de T se interpretan como ellos mismos y los átomos de 
I como V o F, si son básicos, y, en general, por predicados de |M| en la forma 
habitual en semántica. 


Con más detalle, definamos las funciones y predicados de M y las 
correspondencias entre los mismos y los símbolos de F. Como ya se ha dicho, el 
universo y las funciones de M están fijados por definición; los predicados en 
cambio se pueden escoger libremente. 


Por definición de U(T), los términos básicos de I, ti, ta, ..., ta, se identifican 
con los individuos de |M| = U(T) que también escribimos ti, ty, ..., th y que ahora 
definimos como sus significados en M. Entonces, las funciones n-arias fy de M son 
una por cada símbolo de función n-aria f de I (constantes incluidas) y se definen en 
|M| como sigue. f(t, to, ..., tn) := f ti t> ... tn. El segundo miembro de la definición 
es un individuo de |M| = U(T) con lo que la definición tiene sentido. (Nótese el 
sutil matiz gracias al cual f tı tz ... ty representa, por un lado, un término simbólico 
del lenguaje de T y, también, el individuo real de |M] que es el propio significado 
del término). Los predicados de M son V, F y, por cada símbolo de predicado n- 
ario de I, un predicado n-ario de |M]. 


Así, a cada símbolo de función n-aria f de I le corresponde en M la 
función fy, según anunciamos, y a cada átomo básico y a cada símbolo de 
predicado de T le corresponde un predicado de M. 


© RA-MA CAPÍTULO 2. RESOLUCIÓN. SECCIÓN 2.3.3 105 


Cuando una estructura de Herbrand para I es un modelo de I diremos que 
es un modelo de Herbrand para T. Como hemos anunciado, será la elección de los 
predicados de la estructura que se corresponden con los símbolos de I la que 
determine si la estructura es modelo o no. 


Ejemplo 1. Excursus hacia la Completud de la Resolución 


El lector que esté siguiendo la línea de nuestro discurso (resolución y cómo 
si un conjunto de cláusulas es insatisfacible se deducirá la cláusula vacía por 
resolución a partir del mismo: la completud de la resolución) puede preguntarse por 
el sentido de esta nueva Teoría de Herbrand que ha surgido en medio del mismo. 
El propósito de esta inserción es precisamente poder llegar a la completud de la 
resolución y el ejemplo que sigue es un sencillo resumen de cómo vamos a llegar a 
ella, antes de volver a entrar en nuevos detalles de la teoría de Herbrand y su 
aplicación. 


Por otra parte, no querríamos que el tratamiento instrumental que aquí 
recibe hiciera de menos a la teoría de Herbrand. Por sus propios méritos, debidos 
naturalmente a Herbrand y también a Gédel y Skolem, esta teoría ocupa capítulos 
enteros de otras monografías; redujo el examen de los infinitos posibles modelos 
para una teoría al de los modelos “sintácticos” (construidos solamente a partir del 
lenguaje de la teoría) y éstos a su vez, al estudio de conjuntos finitos de proposi- 
ciones. Así surgieron los primeros demostradores de teoremas (procedimientos de 
Gilmore y de Davis y Putnam, véase 2.4) merecedores de tal nombre por su 
eficiencia real aunque modesta. La combinación de la teoría de Herbrand con la 
resolución proposicional y la unificación resultó en la resolución de Robinson que, 
como repetidamente hemos afirmado, es el fundamento de la muy eficiente 
programación lógica. 


En el ejemplo siguiente, como hemos anunciado, ilustraremos en pasos 
sucesivos cómo se puede llegar a la cláusula vacía por una deducción en resolución 
a partir de un conjunto insatisfacible de cláusulas. 

Primer paso. Tomemos los conjuntos 

r: = (FP(d,x), ~V (x), O(x,d)), P(d,m), V(m), ~O(m,d)} y 

T: = ¿7P(d,x), ~V (x), O(x,d)}, P(d,m), V(m) } 
de los que sabemos que el primero es insatisfacible y el segundo es satisfacible y 


cuyo universo de Herbrand se reduce en este caso a {d,m}. Esto hará el ejemplo 
más sencillo. 
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La extensión E(T») es 
{{—P(d,d), V(d), O(d,d)}, {=P(d,m), V(m), O(m,d)}, P(d,m), V(m)} 


Si E(P) es satisfacible nos proponemos demostrar que I’, también lo es. En 
efecto, por hipótesis, E(T2) tendrá un modelo M> y podemos definir un modelo de 
Herbrand M’, para la misma sin más que, como ya dijimos, tomar su universo y 
funciones de Herbrand (que incluyen a las constantes) y hacer V aquellos átomos 
básicos que sean V en M3y F los que lo sean en el mismo modelo. Por ejemplo 


M'AP(dm)=V,  M'AV(m)=V,  M'xXO(m,d)=V,  M'XP(d,d)=F, 
M’(Vd@))=V,  M'XO(d,d))=F. 


Pero, a partir de M’, podemos construir un modelo de Herbrand M para el 
propio conjunto I’; como sigue. Con el mismo universo y funciones de Herbrand de 
T>, definimos 


Pu = {(d,m)}, Vm = {d,m}, Om = ((m,d)). 


Es decir, usamos los valores de las cláusulas base de E(T2), que son las M- 
instancias de I>, para definir los predicados de M, con lo que resulta que todas las 
M-instancias de T, son V, M es modelo de T, que, por tanto, es satisfacible. Esta 
demostración se puede hacer en general para cualquier conjunto de cláusulas 
y su correspondiente extensión: si la segunda es satisfacible, la primera lo es. 
El contra recíproco es el núcleo de la demostración del teorema de Herbrand en la 
versión que aquí utilizamos: si un conjunto de cláusulas es insatisfacible, 
entonces su extensión es insatisfacible. 


Con el primer conjunto anterior, la extensión E(T'¡) de T, = {{-P(d,x), 
=V(x), O(x,d)}, P(d,m), V(m), =O(m,d)}, es ET) = ((-P(d,d), —V(d), O(d,d)}, 
(P(d,m), —V(m), O(m,d)}, P(d,m), V(m), —O(m,d)}, conjuntos ambos 
insatisfacibles como se comprueba fácilmente. 


Aqui termina el primer paso, hemos reducido la insatisfacibilidad de T, a 
la de E(T'¡). En el teorema general de Herbrand ambas son equivalentes, de hecho 
basta considerar un subconjunto finito de E(T',). 


Segundo paso. La demostración de que para E(T¡) o cualquier conjunto 
insatisfacible de cláusulas base (nótese que todavía no hablamos de cláusulas 
cualesquiera) hay una deducción por resolución de la cláusula vacía requiere una 
inducción sobre el número de átomos del conjunto. No es difícil, pero sí un tanto 
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tediosa en el paso inductivo. En nuestro ejemplo demostraríamos que la cláusula 
vacía se deduce de 


a) t{oP(d.d), —V(d), O(d.d)}, (=P(dm), V(m), O(m,d)}, (P(d,m)), 
(Vm); , {>O(m,d)}} 


si, por hipótesis de inducción, se deduce de cualquier conjunto insatisfacible con un 
átomo menos, por ejemplo 


(A)  {{=P(d,d), V(d), O(d,d)}, (P(d,m)), {} , 0(m,d))> 
y también 
(B)  {{=P(d,d), V(d), O(d,d)), (P(d,m), O(m,d)), (P(d,m)), {>O(m,d)}}. 


(1) tiene seis átomos: P(d,d), V(d), O(d,d)), P(d,m), V(m), O(m,d), 
mientras que en (A) y (B) falta el átomo V(m) que, junto con su negación, se ha 
quitado de (1) en dos formas simétricas y por un procedimiento que podríamos 
llamar de tipo fuelle por el modo en que volverá a aparecer el referido átomo V(m) 
en los posteriores conjuntos (A”) y (B”). Más detalladamente, (A) se ha obtenido de 
(1) suprimiendo las cláusulas donde aparece —V(m) (en este caso (—P(d,m), 
—V(m), O(m,d))) y suprimiendo V(m) de las cláusulas donde aparece (en este caso 
{V(m)} que se convierte en {}). (B) se ha obtenido aplicando el mismo proceso, 
simétricamente, a V(m) y —V(m). De esta forma se garantiza que la 
insatisfacibilidad de (1) se transmite a (A) y (B) en general y en el ejemplo, como 
es bastante aparente (la cláusula vacía {}, como sabemos, es insatisfacible). 


Por hipótesis de inducción, la cláusula vacía se deduce tanto de (A) como 
de (B) que tiene un átomo menos que (1). Si ahora restituimos V(m) a las cláusulas 
donde se suprimió en (A) y —V(m) a las correspondientes en (B) obtenemos 


(a°) {{>P(d,d), V(d), O(d,d)}, (P(d,m)), (V(m); , {>O(m,d)}} 


(B)  ftP(dd), —V(d), O(d,d)),f=P(d,m), —V(m), O(m,d), {P(d,m)}, 
0(m,d))> 


con las propiedades de que (A”) U (B’) = (1) y de que, si reproducimos las 
deducciones a partir de (A) y (B) que antes terminaban en la cláusula vacía, 
arrastrando ahora, respectivamente, V(m) y —V(m), resulta que V(m) se deduce de 
(A’) y —V(m) de (B°) con lo cual ambas, V(m) y —V(m), se deducen de (A”) U 
(B”) = (1), y en un paso más se deduce la cláusula vacía. 


108 LÓGICA PARA LA COMPUTACIÓN © RA-MA 


Si V(m), o el átomo seleccionado, por ejemplo, V(d), estuviera sólo en 
cláusulas que al pasar a (A) y (B) (insatisfacibles) no son cláusulas padre de ningún 
paso en la deducción de la cláusula vacía, el razonamiento es el mismo, pero más 
sencillo porque ahora la repetida cláusula vacía se sigue deduciendo de (A”) y de 
(B”) y naturalmente de su unión. 


Lo que hemos hecho con el ejemplo en este segundo paso es utilizar la idea 
fundamental de la demostración del teorema de resolución básica que, como 
anunciamos al principio, asegura la existencia de una deducción por resolución de 
la cláusula vacía para cualquier conjunto insatisfacible de cláusulas base. 
Recuérdese que el término básica no tiene su significado familiar y extra 
científico, sino el de lo relacionado con los términos y fórmulas básicas. 


Con estos dos primeros pasos, hemos llegado a que la insatisfacibilidad de 
T implica la deducción por resolución de la cláusula vacía a partir de E(T). 


Tercer paso. En el tercer paso queremos buscar una deducción por 
resolución de la cláusula vacía a partir del conjunto T, del primer ejemplo, no de 
E(T¡), y, para ello, utilizamos como se verá la deducción explícita de la cláusula 
vacía a partir de E([,) = {{-P(d,d),,V(d),O(d,d)}, (—P(d,m),V(m),0(m,d)), 
P(d,m), V(m) , -O(m,d)) cuya existencia ya conocemos. 


1. (P(d,m), ~V (m), O(m,d)} en E(T;) 
2. P(d,m) en E(T;) 
3. V(m) en E(T) 
4. =O(m,d) en ET) 
5. (2V(m), O(m,d)} resolvente 1 y 2 
6. O(m,d) resolvente 5 y 3 
7.0 resolvente 4 y 6. 


Consideremos el paso 5 con la obtención de la resolvente R*=(—V(m), 
O(m,d)) con cláusulas padres C”=(—P(d,m), —=V(m), O(m,d)) y C’2=P(d,m). C”; 
es una cláusula básica obtenida por la sustitución básica s¡=(x/m) aplicada a la 
cláusula C,=(—P(d,x), V(x), O(x,d)} de Ti: C”, = sı Cı. De la misma forma, C’, 
= P(d,m) = s2 C2, donde C, coincide con su propia instancia básica P(d,m) de E(T'¡) 
y, por tanto, en este caso sz es {}. Si hubiera habido variables comunes a C, y C2, 
las habríamos renombrado previamente a las sustituciones sı y s». Llamemos s a 
(si, s2) que resulta ser un unificador (de máxima generalidad en este ejemplo, 
aunque no necesariamente en todos) de los literales (—P(d,x), —P(d,m)). 
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La cláusula 


R= s(((P(d,x), =VG9, O(x,d)} - (P(d,x))) U ((P(d,m); - (P(d,m)))) = 
sí-VG9, O(x,d)} 


es una resolvente de C¡=(—P(d,x), —~V(x), O(x,d)) y Co=P(d,m) y, además, la 
cláusula R’={—V(m), O(m,d)) resolvente de las cláusulas básicas (—P(d,m), 
—V(m), O(m,d)} = sıCı y P(djm) = s,C, es {}R, donde {} es la sustitución 
identidad, que, en caso de no haber sido s el unificador de maxima generalidad, 
estaria reemplazada por otra s3. 


En resumen, hemos construido R, Cı y Cz a partir del paso 5 de la 
deducción anterior (obtención de R’ como resolvente de C”, y C”,, cláusulas de 
E(P,)) de forma que R es resolvente de C, y C2, cláusulas de TP. 


Si aplicamos este proceso a todas las resolventes convertiremos la anterior 
deducción en la siguiente 


1. {AP(d,x), V(x), O(x,d)} enT, 

2. P(d,m) enT, 

3. Vim) enT, 

4. —O(m,d) enT; 

5. (-V(m), O(m,d)} resolvente 1 y 2, con la sustitución (x/m) 
6. O(m,d) resolvente 5 y 3, con la sustitución {} 
TD resolvente 4 y 6, con la sustitución {}. 


Así, en este tercer paso hemos “elevado” la deducción por resolución de la 
cláusula vacía a partir de E(T'¡) que ya conocíamos, a otra deducción por resolución 
de la cláusula vacía a partir de Tı. Debe ser claro que la última cláusula es la 
cláusula vacía porque para toda resolvente R de esta segunda deducción se cumple 
R’ = sR, siendo R” la correspondiente resolvente de la deducción básica, y una 
instancia básica de una cláusula no vacía no es vacía. Con ello hemos visto también 
las ideas fundamentales del teorema de elevación que después enunciaremos con 
precisión. 


Resumen. En resumen, a partir del conjunto insatisfacible T, hemos 
obtenido que E(T',) también lo es (teorema de Herbrand); para E(T'¡) hay una 
deducción por resolución de la cláusula vacía (teorema de resolución básica) que se 
puede elevar a una deducción por resolución de la cláusula vacía a partir de T; 
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(teorema de elevación). La insatisfacibilidad de T, ha implicado la deducción por 
resolución de la cláusula vacía a partir del propio Tı. Eso es lo que afirma el 
teorema de completud de la resolución que estudiamos a continuación en la 
próxima sección 2.3.4. 


El teorema de Herbrand y otros resultados 


Los tres teoremas que siguen, sin demostración, son necesarios para el 
teorema de completud de la resolución. En el ejemplo anterior se han hecho las 
consideraciones esenciales que permiten construir las demostraciones generales. En 
cualquier caso, dichas demostraciones pueden verse en numerosos textos como 
(Loveland, 1978) y (Chang, Lee, 1973). 


Teorema 1. Teorema de Herbrand 


Si un conjunto finito de cláusulas T es insatisfacible, entonces la extensión 
de I, E(I) es insatisfacible. 


La forma mas general del teorema es una equivalencia entre la 
insatisfacibilidad de I y un subconjunto finito de E(T). Reseñamos solamente la 
versión de condición necesaria porque es la que se va a utilizar. 


Que la teoría y teorema de Herbrand aparezcan aquí de forma instrumental 
no debe oscurecer su importancia y papel esencial en el progreso de la teoría de la 
demostración automática como ya hemos apuntado más arriba en el ejemplo 1 de la 
sección 2.3.3 y explicamos algo más detalladamente en 2.4. 


Teorema 2. Teorema de resolución básica 


Si un conjunto de cláusulas básicas es insatisfacible, entonces existe una 
deducción por resolución de la cláusula vacía a partir del mismo. 


Este teorema que en realidad es un resultado del cálculo proposicional, se 
muestra aún más potente cuando se aplica en el presente contexto de proposiciones 
obtenidas como instancias básicas de fórmulas, cláusulas, de una teoría de primer 
orden. 


Teorema 3. Teorema de elevación 


Si T“ es un conjunto de instancias básicas de las cláusulas del conjunto T y 
existe una deducción por resolución a partir de I‘ de una cláusula B’, entonces 
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existe una deducción por resolución a partir de I de una cláusula B tal que B’ es 
una instancia básica obtenida por una sustitución aplicada a B. 


2.3.4 Completud 


Teorema 1 


Si I es un conjunto insatisfacible de cláusulas, entonces existe una 
deducción por resolución de la cláusula vacía a partir de T. 


Demostración 


Basta repetir para el caso general el proceso que hicimos en el Ejemplo 1 
de 2.3.3. Por el teorema de Herbrand llegamos a un conjunto insatisfacible de 
instancias básicas de las cláusulas de T (la extensión E(T)), de este conjunto 
deducimos la cláusula vacía por el teorema de la resolución básica y de esta 
deducción obtenemos la buscada a partir de T por el teorema de elevación. m 


2.4 ALGUNOS PROCEDIMIENTOS BASADOS EN EL 
TEOREMA DE HERBRAND 


El teorema de Herbrand, en su versión más fuerte, sugiere un 
procedimiento muy natural de demostración, que podemos llamar automática en 
tanto que es un procedimiento; que fue implementado de hecho; y que esta 
implementación, sus posteriores refinamientos y las ideas sobre las que se asienta 
son algunos de los precursores de los actuales demostradores automáticos. 


Expresado informalmente, el procedimiento para demostrar que una 
fórmula es un teorema de una teoría T es muy sencillo: 


e En primer lugar se añade a los axiomas de la teoría T de que se trate la 
negación del cierre de la fórmula que se quiere demostrar, 

e se pasa de este conjunto a otro de cláusulas, según hemos visto anteriormente, 
se genera una sucesión creciente de subconjuntos finitos de la extensión de 
Herbrand y 

e se comprueba la insatisfacibilidad de éstos por métodos del cálculo, o lógica, 
de proposiciones. 


De acuerdo con el teorema general de Herbrand, si la fórmula de partida es 
un teorema de la teoría T, el conjunto de cláusulas es insatisfacible, un subconjunto 
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finito de su extensión de Herbrand también, y el procedimiento lo encontrará antes 
o después. Esto demuestra la completud del procedimiento. La corrección es 
inmediata porque si se llega a un subconjunto insatisfacible, la fórmula es teorema 
de T. 


Obviamente lo que sea un procedimiento natural no deja de ser algo 
subjetivo y la prueba está en que Prawitz (Prawitz, 1960), (Prawitz, 1969) hizo una 
propuesta distinta a la que hemos expuesto en el sentido de que, en vez de generar 
sistemáticamente los subconjuntos de la extensión de Herbrand, calcula los valores 
del universo de Herbrand que sustituidos en las cláusulas originales dan lugar a los 
subconjuntos insatisfacibles buscados. Hacemos esta mención por no caer en el 
simplismo y porque algunos resultados de Prawitz fueron parte del trabajo en que 
se basó Robinson más tarde, pero no diremos más sobre éste, y otros, 
procedimientos de Prawitz, de eficiencia muy limitada por otra parte. 


Nota 1. Completud e indecidibilidad 


Quizá sea éste el punto donde sean oportunas algunas consideraciones en 
torno a la relación entre la corrección y completud, de este procedimiento y del de 
la resolución, con la indecidibilidad y la decidibilidad parcial presentadas en 1.4. Si 
estos procedimientos proporcionan la salida “A es un teorema” si y sólo si A es 
efectivamente un teorema, ¿en qué consiste exactamente la indecidibilidad del 
cálculo de predicados? Posiblemente la clave esté en no perder de vista qué ocurre 
cuando la entrada de cualquiera de los procedimientos es una fórmula A que no es 
un teorema de T. En el que acabamos de describir, no hay ningún subconjunto de la 
extensión de Herbrand que sea insatisfacible y el procedimiento no termina. Lo 
mismo ocurre si aplicamos el método de resolución a un conjunto satisfacible de 
cláusulas (que es el que se obtiene cuando A no es teorema), no vamos a obtener 
ninguna respuesta puesto que la cláusula vacía no se deduce del mismo. Así ocurre 
y así se muestran tanto la indecidibilidad como la decidibilidad parcial de la lógica 
de primer orden: ningún procedimiento, como los dos ejemplos que consideramos, 
puede decidir si una fórmula cualquiera A es o no teorema de T, muchos 
procedimientos pueden reconocer que los teoremas de T lo son, como, de nuevo, se 
comprueba en los dos ejemplos. Y, finalmente, no pensemos que hay una 
contradicción en la constatación de que, para ejemplos concretos, haya formas ad 
hoc de verificar la satisfacibilidad como ocurre en los Ejemplos 1 y 3 de la 
siguiente sección. El procedimiento excluido por la indecidibilidad es uno que 
decida cualquier fórmula. 
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Nota 2. Los subconjuntos de la extensión de Herbrand 


En relación con el penúltimo paso del procedimiento que nos ocupa, la 
sucesión ordenada de subconjuntos de la extensión de Herbrand se puede generar 
recursivamente. El primer subconjunto es el obtenido reemplazando todas las 
variables de las cláusulas de T por las constantes del universo de Herbrand de T`; un 
subconjunto cualquiera se obtiene como la unión del subconjunto del paso anterior 
con el obtenido reemplazando las antedichas variables por los individuos obtenidos 
a partir de los utilizados en el subconjunto anterior, mediante una aplicación de 
todos los símbolos de función de I. De hecho, ésta fue la forma en que Gilmore, 
véase más abajo, implementó el procedimiento. 


Ejemplos sencillos de aplicación del procedimiento informal 
Ejemplo 1. Universo de Herbrand finito 


Si queremos comprobar si Vx B(x) es un teorema de la teoría con axiomas 
no lógicos 3x A(x) y Vx (A(x) > B(x)), reducimos a un conjunto de cláusulas los 
axiomas y la negación de Vx B(x): T = {A(a), —A(x) v B(x), —B(b)) donde a y b 
son constantes de Skolem. La extensión de Herbrand, E, de este conjunto se reduce 
a E = {A(a), —A(a) v B(a), —B(b), —A(b) v B(b)} puesto que en este caso el 
universo de Herbrand es finito {a,b}. La simple observación, o algún método 
elemental, nos muestran que E es satisfacible mediante una estructura donde A(a) y 
B(a) sean V y B(b) y A(b) sean F. Por tanto, TP es satisfacible y Vx B(x) no es 
teorema de la teoría dada. 


Ejemplo 2. Extensión insatisfacible en un paso 


Si ahora queremos comprobar si 3x B(f(x)) es un teorema de la teoría con 
los axiomas no lógicos 4x A(x) y Vx (A(x) > B(f(x))), reducimos a un conjunto de 
cláusulas los axiomas y la negación de 3x B(f(x)): T = {A(a), ~A(x) v B(f(x)), 
—B(f(x))) donde a es una constante de Skolem. Según el método explicado más 
arriba, el primer subconjunto finito de la extensión de Herbrand E(T) se obtiene 
sustituyendo las x por la única constante a del universo de Herbrand (U = (a, f(a), 
f(f(a)), ...}) obteniéndose E, = { A(a), —A(a) v B(f(a)), —B(f(a))) que es 
claramente insatisfacible pues en una estructura que fuese modelo para E,, A(a) 
debería ser V, por la primera cláusula, B(f(a)) debería ser también V por la segunda 
cláusula, con lo cual la tercera no puede ser V. Por tanto E es insatisfacible y 4x 
B(f(x)) sí es teorema de la teoría dada. En el método de Gilmore, al que aludimos 
un poco más abajo, se calcula la forma normal disyuntiva de E,, {A(a) A —A(a) A 
B(f(a))} v {A(a) A B(f(a)) a —B(f(a))) en el ejemplo, y resulta que en todas las 
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conjunciones tenemos un literal y su negación. Entonces podemos terminar 
constatando ya la insatisfacibilidad o sustituirlas por la cláusula vacía, que es 
insatisfacible por definición. 


La sencillez de los ejemplos precedentes se debe a condiciones muy 
particulares que desgraciadamente no podemos esperar en general. En el primero, 
el universo de Herbrand era finito, y en el segundo, aun siendo infinito dicho 
universo, obteníamos un subconjunto insatisfacible de la extensión de Herbrand al 
primer intento. Por tanto, habrá que decir algo sobre métodos no triviales para 
llevar a cabo la comprobación de la insatisfacibilidad de los subconjuntos de la 
extensión de Herbrand con la que termina el procedimiento. 


Puesto que tal extensión no consta más que de términos básicos, 
proposiciones, parece claro que la primera opción son las tablas de verdad que, 
como vimos en su momento constituyen un método correcto, completo e 
ineficiente: su ejecución requiere un tiempo que es una función exponencial del 
número de símbolos, proposiciones, involucrados. 


Aunque no mejoró la eficiencia de las tablas de verdad, Gilmore (Gilmore, 
1960) implementó por primera vez el procedimiento que estudiamos, hecho por el 
cual algunos autores se refieren al mismo como “procedimiento de Gilmore”. La 
forma en que Gilmore comprobaba la insatisfacibilidad pasaba por la reducción a la 
forma normal disyuntiva a la que después se aplicaban ciertas reglas de 
simplificación. Si se intenta usar esta técnica con cualquier ejemplo no trivial se 
comprueba la proliferación de conjunciones cuyo número también es de orden 
exponencial, en este caso en función del número de cláusulas iniciales. 


Davis y Putnam (Davis, Putnam, 1960) mejoraron la eficiencia con un 
método que tiene muchas versiones, una de las cuales examinamos brevemente a 
continuación; y, por supuesto, hay otras alternativas como los árboles semánticos 
(Chang, Lee, 1973) y la resolución en su versión para proposiciones, que es, quizá, 
la alternativa definitiva en este contexto, véase el Teorema de resolución básica, 
Teorema 2 de 2.3.3. 


Procedimiento de Davis y Putnam para la insatisfacibilidad de un 
conjunto de cláusulas sin variables 


Dado un conjunto de cláusulas sin variables, apliquense las siguientes reglas 
mientras ello sea posible, eligiendo, en caso de conflicto, la que tenga el 
número más bajo. 
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1. Regla de tautología. Se suprimen todas las cláusulas que contengan un 
átomo A y Su negación ~A. 


2. Regla de cláusulas unitarias. Si una cláusula, L, es unitaria se suprimen 
todas las cláusulas que contengan a L y se suprime el complementario de L (~L 
si L es positivo y K si L es negativo, ~K) de las cláusulas que lo contengan. 


3. Regla del literal no complementado. Si el literal L aparece en las cláusulas, 
pero no su complementario, se suprimen todas las cláusulas donde aparezca L. 


4. Regla de subsunción. Si una cláusula C contiene todos los literales de otra, 
se suprime C. 


5. Regla de subdivisión. Si en el conjunto de cláusulas están un literal L y su 
complementario L”, se sustituye dicho conjunto por otros dos. En el primero se 
eliminan las cláusulas que contienen a L y se elimina L” de las cláusulas que lo 
contienen. El segundo se obtiene de forma simétrica al primero con L y L” 
intercambiados. 


Si el conjunto o conjuntos resultantes son insatisfacibles el procedimiento 
termina afirmando la insatisfacibilidad del conjunto dado, o la satisfacibilidad 
en caso contrario. 


Nótese que estamos formulando en reglas obviedades como la supresión de 
tautologías y cláusulas subsumidas y las técnicas que en el Ejemplo 1 de la sección 
2.3.3 servían para comprobar la insatisfacibilidad en el contexto de la explicación 
de cómo funcionaba el teorema de resolución básica. La corrección del procedi- 
miento se puede demostrar siguiendo las indicaciones que allí dimos y también 
puede verse en (Chang, Lee, 1973). El siguiente ejemplo está construido 
exclusivamente para ilustrar los principales rasgos del procedimiento. 


Ejemplo 3. Sobre el procedimiento de Davis y Putnam 
Sea el conjunto de cláusulas 
{Av—AvB, C, -CvD, Ev-F, >EvF, -EvFvG}. 


Por aplicación de la Regla 1, suprimimos Av-AvB (una tautología) y 
tenemos 


{C, =CvD, Ev-F, -EvF, -EvFvG} 


Por aplicación de la Regla 2, se suprime la cláusula C y el literal -C de 
=CvD 
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{D, Ev-F, -EvF, -EvFvG} 


Por aplicación de la Regla 3, se suprime la cláusula constituida por el 
literal D pues no aparece su complementario 


{Ev-F, -EvF, >EvFvGj 


Por aplicación de la Regla 4, se suprime la cláusula -EvVFVG subsumida 
por la -EvF 


{Ev-F, -EvF} 


Finalmente, por la regla 5 aplicada a E, y su complementario, se obtienen 
los dos conjuntos 


(ER) 


que son satisfacibles, cada uno por separado, por supuesto. Por tanto, el conjunto 
de partida es satisfacible (haciendo, por ejemplo, C, D, E y F verdaderas). 


Nota 2. En torno al razonamiento automático 


El primer procedimiento de deducción automática que explota satisfacto- 
riamente la potencia de la teoría de Herbrand es el de resolución con unificación 
que ya hemos expuesto en este capítulo y cuya continuación natural es el objeto del 
siguiente. Es el primero, es también plenamente actual y puede afirmarse que es 
una de las aportaciones más importantes al razonamiento automático. Otros 
procedimientos que transitan por distintos caminos también aprovechan la teoría de 
Herbrand como es el cálculo de secuentes de Gentzen (Gentzen, 1935) que ha sido 
ampliamente utilizado en la implementación de demostradores automáticos y que 
se abrió paso en los años 70 del siglo XX en una comunidad científica casi 
totalmente centrada en la resolución. 


No es éste el lugar para un repaso a los numerosísimos métodos de 
razonamiento automático, un campo en plena madurez y que va desde programas 
ad hoc para algún área particular de la ciencia, como el demostrador de teoremas 
de geometría de Gelernter, pionero de la Inteligenia Artificial y del razonamiento 
basado en gráficos (Gelernter, 1963), (Gelernter, Rochester, 1958), hasta Isabelle, 
(Paulson, 1990), un demostrador genérico que puede interactuar con numerosas 
lógicas y tiene una gran capacidad para que el usuario pueda desarrollar nuevas 
aplicaciones. El lector interesado en el tema encontrará una referencia amplia y 
bastante actualizada en (Russell, Norvig, 2004). 
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En esta sección hemos procurado explicar con ejemplos elementales y más 
históricos que de inmediata aplicación, cómo mirar sencilla y razonablemente al 
centro de la teoría de Herbrand y su papel como punto de partida de importantes 
desarrollos. 


Capítulo 3 


ELEMENTOS DE PROGRAMACIÓN LÓGICA Y 
PROLOG 


A partir de la década de 1970 se empezó a considerar la idea de la 
utilización de la lógica como un lenguaje de programación, véase por ejemplo 
(Kowalski, 1974). En una primera aproximación podemos decir que un programa 
lógico, si por el momento hacemos abstracción de su uso, no es más que un 
conjunto de cláusulas como los que hemos visto en el estudio de la resolución. Allí 
vimos ejemplos de deducciones a partir de esos conjuntos, deducciones que se 
interpretaban como demostraciones de teoremas y, a lo sumo, generación de 
respuestas. 


El uso de la expresión “programa lógico” requiere cierta justificación que 
haga sentir al lector que está ante un uso y no un abuso. En la línea, derivada del 
intuicionismo y que considera la lógica como colecciones de enunciados y 
resoluciones de problemas, la cláusula A, =A), 24, ... ~A n es decir A; A A3 A... 
A A,— A significa reducir el problema de resolver u obtener A al de obtener Aj, 
Ao, ... A y y el razonamiento hacia atrás aplicado a A, A A3 A... AA, A no es 
más que una reducción del objetivo de resolver A a los objetivos Aj, A2, ... An. La 
implicación Aj A Ap A... A A,— A ya no es sólo una representación declarativa o 
denotacional de un objeto lógico, la programación lógica nos hace verla como un 
procedimiento (una representación operacional o procedural): “para obtener el 
objetivo A, llame Ud. al procedimiento que obtiene previamente Aj, A>, ... An”. 
Así, nos encontramos abiertamente con los conceptos de procedimiento y 
programa. Para el lector experimentado en PROLOG no deben resultar extrañas las 
anteriores consideraciones sobre todo vistas desde el otro lado: la ejecución de un 
programa se puede entender como una deducción lógica (de la cláusula vacía). 
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Aqui hemos querido subrayar, recíprocamente, el carácter procedural de la lógica 
de cláusulas. 


En un enunciado muy informal y que enseguida se precisará, el uso que se 
hace de los programas lógicos es la deducción por resolución de la cláusula vacía a 
partir de un conjunto insatisfacible. 


En este capítulo no utilizaremos más que programas lógicos cuyas 
cláusulas sean todas ellas cláusulas de Horn, como, por otra parte, es la práctica 
más generalizada. Los motivos son abundantes: la sencillez de su manejo; la base 
teórica donde descansan, singularmente la completud del refinamiento SLD que 
veremos en la próxima sección 3.1.1; la más aparente que real pérdida de 
expresividad (véase la Nota 1 de 1.5.3); y la considerable ganancia en eficiencia, 
recuérdese el algoritmo SAT que estudiamos en 1.5.3 y cuya eficiencia se extiende 
en ciertos aspectos de la resolución para cláusulas no necesariamente básicas. El 
lector debe advertir que, en general, se puede tratar la programación lógica con 
cláusulas no necesariamente de Horn, pero sin ninguna garantía (corrección o 
completud) sobre su funcionamiento y con efectos indeseables incluso en ejemplos 
muy sencillos. 


En los programas lógicos se utilizan diversas versiones de la resolución, 
como veremos en la siguiente sección. Cuando, entre otras cosas, se fija una de 
ellas, se adoptan formas concretas de búsqueda y se dota al programador de 
procedimientos y predicados accesorios, para, por ejemplo, resolver el 
indeterminismo y evitar ejecuciones infinitas, tenemos un lenguaje de 
programación lógica como es PROLOG: una de las posibles formas de llevar los 
programas lógicos a la computación efectiva. 


Históricamente, PROLOG significó bastante más aparte de su realidad 
práctica cotidiana. La programación lógica como programas escritos en un lenguaje 
lógico, declarativo, y con algún demostrador de teoremas o buscador de modelos 
como motor de inferencia, se restringió a su actual sentido con el 
perfeccionamiento en el uso de la resolución. PROLOG, implementación real de la 
programación lógica, como otros lenguajes de programación, ayudó a entender y 
desmenuzar su definición: la programación lógica pura. Hagamos notar finalmente 
cómo a partir de PROLOG, han ido apareciendo las implementaciones más 
actuales de la programación lógica y extensiones tan fecundas como la satisfacción 
de restricciones y la programación lógica concurrente y paralela, entre otras. 


De conformidad con la línea argumental de esta monografía, este capítulo 
no es un manual para el lenguaje PROLOG, ni va a entrar en los entresijos técnicos 
de los diversos refinamientos de la resolución para probar los teoremas de 


©RA-MA CAPÍTULO 3. ELEMENTOS DE PROGRAMACIÓN LÓGICA Y PROLOG. SECCIÓN 3.1 121 


completud que presentaremos. Se trata de llevar la deducción por resolución hasta 
su concreción en un lenguaje de programación, poniendo de manifiesto por qué 
éste funciona como funciona y cómo la resolución explica rigurosamente tal 
comportamiento. Las demostraciones que omitimos requieren técnicas 
notablemente especializadas en relación con el resto de este texto y, en ese sentido, 
no ofrecen un interés especial. 


3.1 REFINAMIENTO Y ESTRATEGIAS DE LA 
RESOLUCION 


A la hora de demostrar la insatisfacibilidad de un conjunto de cláusulas, la 
teoría de Herbrand disminuyó drásticamente el número de candidatos a modelo, y 
la resolución de Robinson, a su vez, redujo la no existencia de modelos (que ya no 
había que buscar más que entre los modelos sintácticos de Herbrand) a la 
deducción de la cláusula vacía a partir del conjunto en cuestión. 


Sin embargo, el espacio del problema, el conjunto de todas las posibles 
deducciones por resolución (véase 2.3.1) a partir del conjunto dado sigue siendo 
excesivamente grande en un sentido muy claro. No disponemos de ninguna 
estrategia o, si se quiere, sólo contamos con la estrategia de saturación, que viene a 
ser lo mismo. La estrategia de búsqueda de la cláusula vacía por saturación consiste 
en ir formando todas las posibles resolventes por niveles sucesivos, con el conjunto 
dado como nivel cero. Con esta búsqueda el problema es absolutamente intratable, 
pues el tamaño de esos niveles, obviamente, crece de forma exponencial. Cada vez 
hay más cláusulas donde buscar los dos padres para generar una resolvente y cada 
vez, en general, las cláusulas son más largas. 


El diseño de un procedimiento que haga practicable la búsqueda a la que 
nos estamos refiriendo descansa sobre dos familias de formas de actuar sobre el 
espacio del problema y su propia génesis. 


En primer lugar, se puede reducir el tamaño del espacio del problema 
restringiendo las posibles formas de obtener una resolvente, eliminando muchas de 
ellas y reteniendo sólo algunas. Aunque es difícil encontrar una nomenclatura 
universalmente admitida en este tema, llamaremos refinamientos o restricciones a 
las definiciones de formas específicas de resolución, formas concebidas para 
utilizarlas, si es posible, con exclusión de las demás. Los refinamientos prohíben 
ciertas cláusulas como padres de una resolvente, o ciertas formas de elegir ambos 
padres o las dos cosas. Si, con ello, hemos eliminado muchas resolventes, el 
espacio de las posibles deducciones que efectivamente vamos a explorar es un 
subespacio sustancialmente menor que el anterior y esto justifica el nombre de 
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refinamiento. Los refinamientos tienen un límite natural en la completud. No será 
aceptable una eliminación de formas de resolución que pueda hacer desaparecer la 
cláusula vacía del espacio del problema. En la sección siguiente expondremos la 
resolución SLD donde se unen varios refinamientos y que es la que utiliza 
PROLOG, como veremos. Nótese que cualquier refinamiento es correcto pues, si 
permite llegar a la cláusula vacía en el espacio de las deducciones por resolución, 
la propia corrección de la resolución (2.3.2) demuestra que el conjunto de partida 
es insatisfacible. 


Por otra parte, el espacio o subespacios a que nos referimos son 
esencialmente no deterministas. No tienen asociada ninguna regla que prescriba el 
camino que se recorre ni siquiera su punto inicial. Llamaremos estrategias, 
estrategias de resolución o estrategias de evaluación, a las reglas que prescriben 
búsquedas del espacio con un orden determinista. Si la necesidad de tales 
estrategias parece obvia en el terreno teórico, cuando la teoría se implementa como 
un lenguaje que se ejecuta en una máquina estándar, resulta indispensable elegir 
una estrategia concreta de búsqueda. Expondremos dos de las principales 
estrategias en la sección que se ocupa de PROLOG. 


3.1.1 La resolución SLD 


La resolución SLD, que fue refinándose gradualmente desde la resolución 
lineal a la resolución lineal con función de selección y de ésta a SLD, se debe a 
Loveland, Luckham, Zamov y Sharanov, en la etapa lineal y a Kowalski, 
parcialmente también con Kuehner, en el resto de su génesis. Los desarrollos 
posteriores son innumerables, pero debemos destacar la aportación de Apt y Emden 
y también Hill y Clark, quienes publicaron las primeras demostraciones de 
corrección y completud. 


El trabajo inicial de Kowalski y Kuhener puede verse en (Kowalski, 
Kuehner, 1983) donde también se encuentran las respectivas referencias a 
Loveland, Luckham, Zamov y Sharanov. El trabajo posterior de Kowalski en este 
tema se encuentra sobre todo en (Kowalski, 1974) y (Kowalski, 1986). Los de Apt 
y Emden, Hill y Clark en, respectivamente, (Apt, Emden, 1982), (Hill, 1974) y 
(Clark 1978). 


Se conoce con este nombre la resolución Lineal con función de Selección y 
para cláusulas Definidas, cláusulas de Horn positivas. Este refinamiento sólo se 
aplica a cláusulas de Horn y, aunque tampoco hay un completo acuerdo en el 
significado de las siglas, todas las interpretaciones del nombre coinciden en el 
contenido del refinamiento de que se trata y que a continuación definimos. 
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Recuérdese que nos interesa probar la insatisfacibilidad de un conjunto de 
cláusulas, porque la demostración de un teorema con unos axiomas dados se redujo 
a la insatisfacibilidad de las cláusulas resultantes de los axiomas y la negación del 
cierre del teorema. Por eso hablaremos siempre de conjuntos de cláusulas, de Horn, 
con una de ellas siempre negativa, procedente de la negación del teorema. 


Definición 1. Resolución SLD 


El refinamiento SLD de la resolución, que llamaremos abreviadamente 
resolución SLD, se aplica a un programa P, formado por un conjunto de cláusulas 
de Horn positivas, más otra cláusula de Horn, N, negativa (el objetivo) y consiste 
en una sucesión de cláusulas negativas N; , N>, ..., tales que cada N;+1, 


e salvo que sea vacía, contiene un átomo designado como el átomo seleccionado 
de la cláusula en cuestión, 

e se obtiene como la resolvente de N; y de una cláusula (o el resultado de un 
renombramiento de las variables de una cláusula) {A, 4B), B», ... “By? de P 
con A unificable con el átomo A, seleccionado de N, y, 

e siN; era {Ap A)... A pj, Nix; es de la forma s{7A), ... Ars Br, ... By 
—Aj+1,... aA p} con s un unificador de máxima generalidad de A y Ay. 


Una resolución SLD que termina con la cláusula vacía se conoce como una 
refutación SLD. La resolución SLD diremos que es correcta si la refutación de 
PUN implica la insatisfacibilidad de dicho conjunto. El resultado recíproco se 
conoce como completud de la resolución SLD con respecto a la refutación. 


La composición de todas las sustituciones definidas a lo largo de una 
refutación se conoce como la sustitución respuesta. Como ya vimos en algunos 
ejemplos del capítulo anterior, el término “respuesta” tiene que ver con el hecho de 
que en la programación lógica esta sustitución se interpreta como la respuesta a una 
cuestión acerca de una base de conocimiento: ¿es 3xB un teorema? y, si lo es, 
¿para qué constante a es B(a)? 


Como ya observamos en la introducción de esta Sección 3.1, cualquier 
refinamiento de la resolución es correcto. La completud debe ser demostrada en 
cada caso. 


Teorema 1. Completud de la resolución SLD 


Sea P un programa formado por un conjunto de cláusulas de Horn 
positivas y N una cláusula de Horn negativa tales que P UN es insatisfacible. 
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Para cualquier átomo de N, existe una refutación SLD de P UN con ese átomo 
como el primer átomo seleccionado. 


La demostración puede verse en (Apt, Emden, 1982). 


3.1.2 Utilización de la resolución SLD y otros refinamientos 


Cualquier procedimiento simbólico que busque una refutación SLD, si 
existe, se puede considerar como un demostrador automático de teoremas. Sin 
embargo y siguiendo el hilo de esta monografía, nuestro interés se dirige a la 
implantación de la programación lógica como un lenguaje de programación, 
PROLOG, cuyo intérprete es precisamente un procedimiento de utilización de la 
refutación SLD como veremos más adelante. 


En la misma referencia (Apt, Emden, 1982) se muestra que aún caben 
refinamientos de la propia refutación SLD. En primer lugar, el espacio de todas las 
refutaciones se puede reducir a un árbol con raíz en N, la cláusula objetivo 
negativa, es decir que, en la sucesión N; , N2, ... de cláusulas negativas que define 
la resolución SLD, N; = N. Este árbol con raíz en N tiene la propiedad de que si P 
UN es insatisfacible, el árbol contiene a la cláusula vacía. Por otra parte, tampoco 
hace falta considerar todas las posibilidades de selección de un átomo en cada 
cláusula de la sucesión. Cualquier forma de selección conserva la completud de la 
refutación SLD. En consecuencia y por sencillez, seleccionaremos siempre el 
primer átomo de cada cláusula negativa. 


En resumen: 


El conjunto de las resoluciones SLD aplicadas a un programa P, formado 
por un conjunto de cláusulas de Horn positivas, junto a otra cláusula de Horn, N, 
negativa (el objetivo) se puede reducir a un árbol con raíz N y cuyas ramas son 
sucesiones de cláusulas negativas N, , N2, ..., tales que N, = N y cada Niş; 


e se obtiene como la resolvente de Ni, y de una cláusula (o el resultado de un 
renombramiento de las variables de una cláusula) {A, =B,, —B3, ... B¿) de P 
con A unificable con el primer átomo A, de N, y, 

e siN; era {—A), Az, ... A p}, Nn es de la forma s[B,, ... By A)... Ap) 
con s un unificador de máxima generalidad de A y A). 


Ejemplo 1. Las deducciones SLD para un conjunto de cláusulas 


Representemos gráficamente el árbol con raíz en la cláusula objetivo y que 
contiene todas las deducciones SLD obtenidas a partir del programa P 


©RA-MA_ CAPÍTULO 3. ELEMENTOS DE PROGRAMACIÓN LÓGICA Y PROLOG. SECCIÓN 3.1.2 125 


rı mismo_padre(X,Z):- mismo _padre(Y,Z), hermanastros(X, Y). 
hz mismo_padre(X,X). 
hz hermanastros(m,p). 


y con el objetivo ?- mismo _padre(X,p). Se tiene el árbol de la Figura 3.1. El 
predicado “mismo_padre” es abreviado como mp y “hermanastros” como hs. Cada 
nodo incluye también la sustitución que afecta al objetivo. 


La línea de trazos corresponde a una rama infinita pues, al usar 
reiteradamente la cláusula rı, va aumentando indefinidamente el número de 
literales hs(X;, Yx). 


mp(X,p) s={} 
Ti APR o OR 
mp(Y p),hs(X,Y) s={} o s=(X/p) 


Tı ee xs 


mp(Y1,p),hs(Y, Y1),hs(X,Y) s={} hs(X,p) s={} 


ASS 


: hs(Y,p),hs(X, Y) s={} o s={X/m} 
h; 
hs(X,m) s={} 

Figura 3.1 


Nota 1. Otros refinamientos y su relación con SLD 


Lo elaborado de la resolución SLD hace que pueda considerarse como un 
procedimiento que incluye o tiene rasgos en común con otros refinamientos que se 
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encuentran en los textos de la materia. Aunque no sea el objetivo de éste, 
presentamos algunos de ellos por su relación con la resolución SLD, como hemos 
dicho, y para subrayar aunque sea someramente el interés que tienen por sí mismos 
para la simplificación y eficiencia de los procedimientos de búsqueda tanto en la 
demostración automática en general como en la resolución. Prueba de ello son los 
extensos tratamientos que aparecen en (Chang, Lee, 1973) y (Loveland, 1978) y la 
utilidad de muchos, incluso cuando no hay resultados de completud. 


Es el caso de la resolución input y la resolución unidad, o “unit”, que, en 
los casos en que pueden aplicarse resultan de una gran eficiencia. En la resolución 
input a partir de un conjunto C, uno de los padres de cada resolvente ha de estar en 
C. En la resolución unidad, ha de ser una cláusula de un solo literal. La resolución 
SLD es un caso particular de resolución input. En (Chang, Lee, 1973) se demuestra 
que ambos refinamientos (input y unidad) son equivalentes y pueden verse 
ejemplos en los que en combinación con otros refinamientos o estrategias se puede 
obviar la no completud manteniendo la eficiencia. 


La resolución P exige que al menos uno de los padres de una resolvente 
sea una cláusula positiva. La resolución N exige que al menos uno de los padres de 
una resolvente sea una cláusula negativa. Ambas son completas respecto a la 
refutación y están claramente integradas en la resolución SLD. 


La resolución SLD es, por definición, lineal. En efecto. Una deducción a 
partir de un conjunto C de cláusulas por resolución lineal se define como una 
sucesión de cláusulas C; , C2, ..., tales que Cı € C y cada Ci+ı se obtiene como la 
resolvente de C; y de una cláusula o bien perteneciente a C o bien colocada 
anteriormente en la sucesión. (Nótese que una deducción así tiene el carácter 
secuencial de una computación.) Históricamente, su introducción supuso un gran 
avance respecto a la resolución sin ninguna restricción, sobre todo por la 
posibilidad de utilizar búsqueda heurística en un espacio de estructura bastante más 
simple que el espacio de todas las deducciones por resolución. La resolución lineal 
también es completa respecto a la refutación. Véase (Chang, Lee, 1973). 


La regla general de resolución considera las cláusulas como conjuntos de 
literales, así las definimos, sin ningún orden dentro de los mismos. Sin embargo, 
implícitamente, la resolución SLD está utilizando un orden al usar siempre el literal 
positivo de una cláusula de P para obtener cada resolvente. La escritura usual de 
estas cláusulas en programación lógica es ordenada y con el literal positivo en 
primer lugar (A, —B;, —B), ... By), como supone, sin aviso previo, la propia 
definición de la resolución SLD. Es más, el refinamiento de la resolución SLD que 
vamos a usar aquí, y que definimos a continuación, utiliza explícitamente una 
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ordenación que se fija de antemano en el dato de entrada, P y N, y se emplea y 
preserva en cada obtención de una resolvente. 


Una de las formas generales de tener en cuenta el orden de los literales en 
las cláusulas es la resolución ordenada, que consiste en aplicar el principio 
general de resolución, 2.3.1, a cláusulas ordenadas C, y C, considerando la 
concatenación resolvente s((sı Cı - L) U (s2 C2 - ~L’) como una cláusula ordenada 
a su vez. Nótese que la propia definición primitiva ya establecía que primero se 
colocaban los literales procedentes de la cláusula con el literal unificado positivo y 
después los de la otra. La resolución ordenada también es completa. (Chang, Lee, 
1973): 


Nota 2. Coincidencias en los refinamientos 


Con todo lo dicho, debe quedar claro que cuando utilicemos la resolución 
en su implementación PROLOG y nos refiramos a la resolución SLD, igualmente 
podríamos hablar de resolución lineal input ordenada y con selección del primer 
átomo, como hacen algunos textos, pues la superposición de los diversos 
refinamientos que involucran ambos conceptos tiene el mismo resultado final. 


3.2 PROLOG 


Cuando un programa lógico tiene que ejecutarse en un ordenador real, es 
necesario un lenguaje de programación, PROLOG, que proceda a esa ejecución real. 
Partiendo del programa lógico, esencialmente no determinista, PROLOG debe 
ejecutarse efectivamente, es decir en forma determinista y secuencial, y eficientemente, 
en un tiempo razonable. 


Con las nociones teóricas precedentes, el lenguaje PROLOG, cuyo 
funcionamiento podría parecer misterioso o, cuando menos, oscuro, aparece como 
asentado sobre un fundamento claro y en otro nivel de abstracción: la lógica 
estudiada hasta aquí. Desde este punto de vista y en síntesis, un programa 
PROLOG consta exclusivamente de cláusulas de Horn afirmativas; cuando se 
plantea un objetivo o consulta en forma de cláusula de Horn negativa, se pone en 
funcionamiento un algoritmo de exploración en profundidad con vuelta atrás del 
árbol de todas las deducciones SLD con raíz en la cláusula objetivo (resoluciones 
SLD) y se detiene si encuentra que ha deducido la cláusula vacía o se completa la 
exploración sin hallarla. Es decir: un refinamiento de la resolución, SLD, más una 
estrategia para la misma, búsqueda en profundidad con vuelta atrás. Esta síntesis 
no incluye las peculiaridades de la implementación, tales como predicados propios, 
evaluaciones de ciertos predicados y otros procedimientos auxiliares, a algunos de 
los cuales nos referiremos más adelante. 
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El párrafo precedente resume toda la teoría que hemos ido exponiendo y 
proporciona al lector familiarizado con el lenguaje de programación la base para 
comprender por qué funciona como funciona. En lo que sigue no hay desarrollos 
teóricos nuevos sino una exposición con cierto detalle de la anterior síntesis 
entendida como explicación divulgativa para el profano en PROLOG. Referencias 
de mayor alcance se encuentran en la Nota Final de esta obra. 


Ejemplo 1. Ejecuciones de un programa PROLOG 


Volvamos a un ejemplo que ha aparecido en anteriores contextos y que se 
encuadra en una asentada tradición de ejemplos fabricados con teorías sobre 
vínculos familiares, véase, por ejemplo, (Kowalski, 1986). Escribiremos las 
cláusulas con la sintaxis L: - Li, L2, ...Lx., donde L es el posible literal positivo y 
Li, para i=1, 2, ..., k, representan a los posibles literales negativos por sus átomos 
correspondientes. 


Programa: 


Ti: hijo_de(X,david): - padre _de(david,X), varon(X). 
hı: padre de(david, manuel). 

h>: padre de(david, paco). 

h3: varon(manuel). 

ha: varon(paco). 


Cada línea del programa corresponde a una afirmación. Las cláusulas 
puramente positivas, h;, son afirmaciones elementales, hechos, el resto se conoce 
como reglas porque expresan implicaciones: 


hijo_de(X,david): - padre_de(david,X), varon(X) 


es la sintaxis PROLOG para la forma clausal de Vx (padre_de(david,x) A varón(x) 
> hijo de(x,david)). Como puede observarse, hay ciertos convenios propios del 
lenguaje. Las variables deben comenzar por mayúscula, mientras que las 
constantes, los demás símbolos de función y los de predicado comienzan con 
minúscula. La sintaxis de las cláusulas es la indicada más arriba donde debe 
notarse que siempre terminan con el punto de la puntuación habitual. 


La ejecución del programa se activa por la adición de una cláusula objetivo 
que, como ya observamos anteriormente, es una cláusula de Horn negativa (?-L;, 
Li, ..., Lx.) obtenida como la negación de la conjunción de literales que es siempre 
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el objetivo perseguido en el sentido de saber si se deduce o no de las cláusulas que 
constituyen el programa. 


Algunos ejemplos de ejecución de nuestro programa ejemplo son 


?- hijo_de(paco,david). 
true 


hijo_de(paco,david),hijo_de(manuel,david). 
true 


?- hijo_de(X,david). 
X = paco ; 
X = manuel. 


?- hijo_de(david,X). 
false. 


cuyos sentidos declarativos (significados del programa entendido como todo 
aquello que se deduce del mismo) son que, respectivamente, las fórmulas 


hijo_de(paco,david), hijo_de(paco,david)Ahijo_de(manuel,david), 3x 
hijo_de(x,david) 


se deducen de las cláusulas del programa, mientras que no es el caso para la 
formula 3x hijo_de(david,x). 


Nótese que, sin necesidad del predicado Resp que mencionamos en 2.3.1, 
el programa ejecuta y guarda las sustituciones necesarias para unificar, con lo que 
la respuesta a un objetivo como 3x hijo_de(x,david) (hijo_de(X,david), en forma 
clausal y PROLOG) incluye también las constantes (paco y manuel) cuya 
existencia se ha demostrado. 


3.2.1 La resolución PROLOG 


En este punto es muy conveniente recordar el Ejemplo de 3.1.2 y la Figura 
3.1 que lo ilustra. Veremos enseguida que este ejemplo es un buen soporte para 
ilustrar muchos de los rasgos de la ejecución de un programa P de PROLOG que, 
como anunciamos, consiste esencialmente en una búsqueda en profundidad con 
vuelta atrás del árbol con raíz en la cláusula objetivo y que contiene todas las 
deducciones SLD obtenidas a partir de dicha cláusula y el programa P. 
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Más concretamente, el algoritmo que lleva a cabo esta búsqueda es un 
recorrido recursivo del árbol, con cada uno de sus nodos etiquetado con una 
cláusula negativa :-O¡, O», ..., Ox. y con la sustitución que ha llevado hasta él (en 
el nodo raíz se coloca la sustitución identidad {}). Informalmente podemos escribir 
dicho algoritmo como sigue: 


Entrada: Programa P con cláusula objetivo N que es, junto con la 
sustitución {}, la etiqueta del nodo “raíz”. 

El primer nodo examinado es la raíz. 

Si, la cláusula C que etiqueta el nodo que está siendo examinado es la 
cláusula vacía, entonces se termina el procedimiento escribiendo que la 
búsqueda ha concluido con éxito y la sustitución que acompaña a C. 

Si C no, es la cláusula vacía sino de la forma :-O;, O», ..., Ox. 
entonces se intenta unificar O, con el primer literal de alguna cláusula de 
P no utilizada todavía con el nodo actual. Las cláusulas de P se recorren 
en su orden natural hasta la última. 

Si. la unificación es posible entonces se forma la resolvente de C 
y la correspondiente cláusula de P. La nueva cláusula creada, que será la 
etiqueta del nodo descendiente del nodo etiquetado con C, se renombra 
como C y, con su nodo correspondiente, se somete de nuevo al 
procedimiento que comienza en el primer Si,. Cada cláusula nueva se 
acompaña de la sustitución que se ha efectuado para llegar a ella desde la 
raíz. 

Si no, es posible la unificación anterior (se produce un 

“fallo”), entonces 

Siz el nodo examinado es el nodo raíz se termina el 
procedimiento sin éxito 
si no, entonces se cambia al nodo ascendiente 
del que estaba siendo examinado, se renombra su 
etiqueta como C y se somete de nuevo al procedimiento 
que comienza en el primer Si,. 
Si el procedimiento termina sin éxito se escribe que se ha producido un 
fracaso. 


Nota 1. Distintos significados de los programas PROLOG 


El procedimiento anterior se detiene al encontrar una cláusula vacía, 
independientemente del hecho de que dicha cláusula pueda aparecer en más hojas 
del árbol. La forma de adjudicar significado al programa entendido como conjunto 
de cláusulas que denotan inferencias, más todo aquello que se deduce del mismo se 
suele denominar denotacional o declarativa. En este contexto la detención con la 
cláusula vacía significa que, si el objetivo N era :- Ay, Ao, ..., Ax, entonces la 
fórmula 3x; ... IXm (Ai A A2 A ... A Ax) se deduce de las cláusulas que forman el 
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programa y que el resultado de la sustitución final aplicado a X;,..., Xm nos 
proporciona una tupla que verifica A; A Ap A... A Ax. 


Como complemento de la anterior forma, estatica, de ver el significado de 
un programa, se puede entender que, dinamica, operacional o proceduralmente, un 
programa también significa cómo se ejecuta, cuál es el efecto de sus instrucciones, 
cómo llama a un procedimiento para conseguir un objetivo, en qué consisten 
ciertos medios de control y cómo todo esto afecta a su terminación y eficiencia. 
Estas dos descripciones no son definiciones formales de semánticas, que no se 
reducen a dos, son mucho más exigentes en detalles y precisión y en cuyo estudio 
no vamos a entrar aquí. En el presente contexto son formas de subrayar distintos 
aspectos de los programas PROLOG de forma similar al uso que haremos de los 
términos lógica y control de la ecuación de Kowalski, de la que tratamos en la 
Sección 3.2.3 y posteriores. 


Nota 2. Procedimiento de búsqueda completa. Resolución PROLOG 


Con leves modificaciones (véase el Ejercicio 1 de la sección 3.2.6) se 
puede hacer que, después de que el procedimiento escriba que se ha producido un 
éxito al deducir por primera vez la cláusula vacía y tener así una respuesta al 
objetivo, continúe recorriendo todo el árbol, si se puede, en busca de todas las 
posibles soluciones. Así, en ciertos casos, pueden recorrerse todas las ramas del 
árbol o encontrar todas las tuplas que verifican A; A A2 A ... A Ay o ambas cosas. 
De hecho, ése es el procedimiento implementado en los intérpretes habituales de 
PROLOG y ese sentido es el que daremos a la expresión “resolución PROLOG” 
como una abreviatura para referirnos al algoritmo, definido más arriba y con la 
modificación anterior, que hace la búsqueda en profundidad con vuelta atrás del 
árbol con raíz en la cláusula objetivo y que contiene todas las deducciones SLD 
obtenidas a partir de dicha cláusula y el programa P. 


3.2.2 Búsqueda en profundidad 


El Ejemplo 1 de 3.1.2 y otros estrechamente emparentados con él nos van a 
servir para presentar de una forma sencilla diversos rasgos de la resolución 
PROLOG que, naturalmente, son genéricos y no exclusivos del ejemplo particular. 


No debe olvidarse, como acabamos de explicar, que la expresión 
“resolución PROLOG” ya incluye la búsqueda de la cláusula vacía en todos los 
nodos donde aparezca. 


En el ejemplo al que aludíamos, Figura 3.1, observamos en primer lugar, 
que el árbol de las deducciones tiene una rama infinita que el procedimiento 
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recorre por la particular ordenación de los literales de la regla rı, la primera 
cláusula del programa. Por tanto, el procedimiento no para en ningún momento. En 
efecto, en la raíz se entra directamente al bucle “Si C no,” (puesto que el objetivo 
en la raíz no es la cláusula vacía) y ya no se sale de él: (i) nunca falta una cláusula 
del programa, la rı, para descender a una resolvente nueva; y (ii) la nueva 
resolvente nunca va a ser la cláusula vacía porque en cada paso se le añade un 
literal más de la forma hs(X;, Y). 


Con esto comprobamos que efectivamente la búsqueda es en profundidad: 
mientras un nodo del árbol tenga un descendiente el procedimiento bajará hasta él. 


En nuestro ejemplo y por lo que se refiere a la rama infinita, que es la que 
efectivamente va a elegir el procedimiento como ya hemos explicado, la búsqueda 
en profundidad no termina. La cláusula vacía sí se deduce de P y el objetivo, como 
se ve en dos de las ramas, pero el algoritmo no va a llegar a esa conclusión. Es 
claro que esto puede suceder con éste y otros muchos programas por lo que la 
resolución PROLOG no es, obviamente, completa aunque sí es correcta por la 
propia corrección de la resolución como sistema formal. 


Resumimos estas consideraciones en el siguiente teorema. 


Teorema. La técnica de utilización de la resolución PROLOG como búsqueda en 
profundidad es correcta, pero no es completa. 


El mismo ejemplo también da pie a la siguiente sección sobre una 
alternativa a la búsqueda en profundidad. 


3.2.3 Búsqueda en anchura 


Una búsqueda en anchura del árbol de las deducciones es aquella en la que 
no se pasa a un nodo más profundo mientras no se hayan considerado todos los del 
nivel anterior. La raíz tiene el nivel cero y el nivel de un nodo cualquiera es el de 
su antecesor más uno. 


En una primera consideración, la búsqueda en anchura parece más útil que 
la búsqueda en profundidad puesto que es naturalmente completa: todo nodo es 
examinado más pronto o más tarde con lo que, si la cláusula vacía está en el árbol 
la búsqueda en anchura la encontrará ciertamente. 


Sin embargo los intérpretes usuales de PROLOG no utilizan búsqueda en 
anchura por razones de eficiencia. Salvo casos muy sencillos, como un árbol con 
una sola rama, se produciría una explosión combinatoria al haber una cantidad de 
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nodos en cada nivel que en general es función exponencial de dicho nivel. En 
consecuencia, no sería realista esperar resultados prácticos de la utilización de 
semejante búsqueda cuando, por el contrario, la eficiencia de la búsqueda en 
profundidad es incontrovertible. 


El precio que hay que pagar por la eficiencia es la posibilidad real de que 
PROLOG se hunda en una rama infinita del árbol incluso en el caso en que la 
cláusula vacía esté en otra rama. 


Es el momento de recordar la tantas veces citada ecuación de Kowalski que 
utilizó en el presente y otros muchos contextos (Kowalski, 1979), (Kowalski, 
1986). 


Algoritmo = Lógica + Control. 


La componente lógica especifica el conocimiento que se usa en la 
solución del problema de que se trate, mientras que la componente de control 
determina las estrategias de solución por medio de las cuales dicho conocimiento 
se utiliza. En la programación lógica es donde más clara resulta la distinción 
entre los dos sumandos. El programa debe contener, casi exclusivamente, el 
conocimiento lógico del problema que se está resolviendo (una refutación) 
mientras que la forma en que esa resolución se lleva a cabo, el control, debería 
estar a cargo de la implementación. Sin embargo la única salida ante la aparición 
de los peligros inherentes a la opción por la búsqueda en profundidad está en 
dejar parte del trabajo al programador. El programador deberá conocer los 
conceptos implicados, reordenar los programas e introducir los mecanismos de 
control que proporciona el intérprete de forma que el recorrido del árbol SLD se 
optimice (véanse los ejemplos que siguen). La separación transparente entre 
Lógica y Control se desvanece un tanto. Una implementación real no siempre 
puede atenerse estrictamente a lo deseable en teoría. 


3.2.4 Las ramas infinitas 


Siguiendo con el ejemplo anterior (Ejemplo 1 de 3.1.2), ya observamos que 
un árbol de deducciones puede tener una rama infinita, que esa rama puede ser la 
primera por la izquierda y que, por la definición del algoritmo de búsqueda, el 
procedimiento la va a seguir indefinidamente y la ejecución del programa no va a 
concluir nada sobre el objetivo. 


En el referido ejemplo esta situación se debe al carácter recursivo de la 
regla mismo_padre(X,Z):- mismo_padre(Y,Z), hermanastros(X,Y) y al hecho de 
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que el literal donde se hace la llamada recursiva, mismo padre(Y,Z), ocupa el 
primer lugar en la lista de objetivos. 


mp(X,p) s={} 


hy T3 
o s= {Xp} MOL PASO) =0 
hs(X.p) = MpOY uphhs(Y, YO hY) =E 
aK (Kim) SPA 0 
to | 
hs(Xm) s=} ! 
Figura 2 


Cambiando ligeramente el orden del programa tenemos el nuevo programa 


h; mismo_padre(X,X). 
hz hermanastros(m,p). 
rz mismo padre(X,Z):- mismo_padre(Y,Z), hermanastros(X, Y). 


que con el mismo objetivo ?- mismo_padre(X,p). produce el árbol de la Figura 3.2 
donde la rama infinita se ha desplazado hasta la derecha, la resolución PROLOG 
proporcionará las dos soluciones mp(p,p) y mp(m,p) y, si seguimos pidiendo 
soluciones, tras una vuelta atrás en el nodo hs(X,m) s=() (consideraremos más 
explícitamente la vuelta atrás en una sección posterior) vuelve a la rama infinita 
para no salir ya del bucle. 


Con ello hemos visto que un ligero cambio en el programa puede hacer que 
éste alcance el éxito aunque termine en un bucle que provoca un desbordamiento 
de la memoria del que las diversas implementaciones de PROLOG salen con 
mensajes de error, falta de respuesta, etc. 
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Que la rama infinita continúe apareciendo en el árbol no es ni una muestra 
tangible de la indecidibilidad de la lógica de primer orden ni siquiera algo 
intrínseco al programa en cuestión entendido como puro programa lógico sin 
servidumbres en el orden de escritura o ejecución. Expliquemos algo más estos dos 
extremos. 


mp(X,p) s={} 
hı T3 
o s={X/p} hs(X,Y), mp(Y,p) s={} 
hz 


mp(p,p) s={ X/m } 


h, T3 
o $={X/m} hs(p,Y),mp(Y,p) 
Figura 3.3 


En el caso en que el objetivo se sigue del programa lo que sabemos sobre 
decidibilidad nos obliga a pensar que un razonamiento adecuado lo pondrá de 
manifiesto. Es lo que ha ocurrido con la última versión del ejemplo que aclara que 
la rama infinita no estaba por un problema de indecidibilidad. Es más, con otro 
cambio en el orden tenemos el programa 


hı mismo_padre(X,X). 
hz hermanastros(m,p). 
ts mismo_padre(X,Z):- hermanastros(X,Y), mismo_padre(Y,Z). 


que con el mismo objetivo ?- mismo_padre(X,p). produce el árbol de la Figura 3.3 
donde la rama infinita ha desaparecido. Como ya anunciamos, a la hora de 
preprocesar un programa lógico con un objetivo, el trabajo del programador es 
decisivo para que termine o no, proporcione las soluciones en cierto orden, etc. 
Desgraciadamente no hay, como cualquiera puede imaginar, un procedimiento o 
regla general que dicte el trabajo de programar. Sí hay ciertas heurísticas fruto de la 
experiencia, algunas de las cuales se han utilizado en los ejemplos precedentes 
(hechos antes de reglas, poner la llamada recursiva al final de la cláusula, cuando 
sea el caso) más otras que van más al meollo de la lógica como la que exponemos a 
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continuación. El papel de este buen uso de la programación podrá evitar búsquedas 
infinitas en un buen número de casos, pero, insistimos, no en todos. 


Ya hemos analizado con cierto detalle el caso en el que el objetivo se sigue 
del programa, pero ¿qué ocurre cuando no es así? La indecidibilidad de la lógica de 
primer orden se traduce aquí en que tiene que haber casos en que el programa no 
pueda hacer otra cosa que hundirse en una rama infinita sin que se pueda hacer 
nada por remediarlo. Por ejemplo, si sustituimos el programa que ya usamos en el 
Ejemplo 1 de 3.2 por este otro breve programa 

hijo_de(manuel,david) s={} 
ri 
padre_de(davifl, manuel) s={} 
T2 
hijo_de(manyel,david) s={} 
Ti 
padre_de(davifl, manuel) s={} 
T2 i 
i 
Figura 3.4 


rı: hijo_de(manuel,david): - padre_de(david, manuel). 


r2: padre_de(david, manuel):- hijo_de(manuel,david). 
con el objetivo ?- hijo_de(manuel,david)., no puede dar lugar más que al árbol de 
la Figura 3.4. 


puesto que hijo_de(manuel,david) no se deduce del programa ni la cláusula vacía 
del programa con el objetivo. 


Sin embargo, aunque en este nuevo caso el objetivo sí se deduce del 
programa, la variación sobre el anterior 


rı: hijo _de(manuel,david): - hijo_de(manuel,david). 
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hz: hijo_de(manuel,david). 


con el mismo objetivo, ?- hijo_de(manuel,david)., también entra en un bucle 
puesto que la rama infinita está a la izquierda de la que termina en la cláusula 
vacía. Un cambio de orden en el preproceso resolvería esta dificultad, y también se 
infiere del ejemplo la regla de evitar circularidades que, aunque puedan estar 
menos claras, en el fondo siempre se reducen a la presencia de L:-L. Para terminar, 
no deje de observarse que, no obstante la bondad de la regla “no circularidades”, no 
siempre es de aplicación, como en el penúltimo ejemplo, y la indecidibilidad se 
mantiene como una realidad independiente de refinamientos y estrategias pues eso 
es lo que significa su estatus de meta teorema. 


3.2.5 La vuelta atrás 


Si aplicamos a los árboles de los ejemplos anteriores el procedimiento de 
resolución PROLOG o estudiamos nuevas y sencillas variaciones sobre el ejemplo 
que repetidamente hemos estudiado, como el programa 


hs(X,Y), mp(Y,p) s={} o s={X/p} 


mp(X,p) s={} 


h; 


mp(p,p) s={ X/m } 


ep 


Figura 3.5 


Ti 


hs(p,Y),mp(Y,p) 


rı mismo padre(X,Z):- hermanastros(X, Y), mismo_padre(Y,Z). 
h> mismo _padre(X,X). 


h,  hermanastros(m,p). 
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con el mismo objetivo ?- mismo_padre(X,p). (véase la Figura 3.5), observamos 
diversas instancias de la vuelta atrás desde un nodo a su antecesor, o bien por entrar 
en el Si no, del procedimiento definido, al no poder generar nuevos descendientes o 
por llegar a una cláusula vacía que, en la resolución PROLOG que utilizamos, no 
supone el fin del procedimiento. 


mp(X,p) s={} 
qT 

hs(X, Y),mp(Y,p) s={} 
a 

mp(p,p) s={ } 


Ti | 
hs(p, Y),mp(Y,p) s={} 


Figura 3.6 


En la Figura 3.5 las flechas muestran el orden en que se visitan los nodos 
incluidas las vueltas atrás en los nodos con, respectivamente, las etiquetas 
hs(p, Y),mp(Y,p) y o s={X/m}. 


En realidad la búsqueda en profundidad y la vuelta atrás no son dos 
conceptos separados. La búsqueda es búsqueda-en-profundidad-con-vuelta-atrás, 
una idea única e indivisible. Si aquí hemos llamado la atención sobre su segundo 
aspecto es por si ha podido quedar oscurecido en las consideraciones de las 
secciones anteriores. La sencillez de los ejemplos tiene la intención de aclarar los 
conceptos, pero ha hecho que la vuelta atrás se haya necesitado en muy raras 
ocasiones. El programa 


rı mismo padre(X,Z):- hermanastros(X, Y), mismo_padre(Y,Z). 


h>  hermanastros(m,p). 
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con el objetivo ?- mismo_padre(X,p). produce un árbol (Figura 3.6) de una sola 
rama que se recorre dos veces: en profundidad y hacia atrás. 


3.2.6 Predicados y funciones de la implementación 


Las diversas implementaciones de PROLOG ofrecen ciertos predicados y 
funciones del sistema o predefinidos que a la persona no experimentada le pueden 
extrañar por su uso, sus restricciones y su propia apariencia. 


Como ya hemos dicho anteriormente, un propósito de esta monografía es 
dar razón lo más rigurosa, completa y sencilla posible del funcionamiento de la 
programación lógica y el lenguaje PROLOG. En ningún caso se pretende hacer de 
ella o alguna de sus partes un manual de utilización del lenguaje. Por ello, esta 
sección debe entenderse como una ventana para que el profano pueda entrever 
algunos aspectos que por su misma naturaleza no estaban en todo lo visto hasta 
ahora. También puede ser el punto de partida para una continuación de este estudio 
por las líneas apuntadas en la Nota Final de esta obra u otras cualesquiera. Para el 
programador, se puede tomar esta sección como una sencilla llamada de atención 
para que haga un uso lúcido y prudente tanto de los procedimientos asociados a la 
aritmética y el predicado corte (que son los únicos que vamos a considerar), como 
de todos los demás. 


Esta advertencia no supone olvidar que el programador no debe considerarse 
atado a la pura programación lógica, ignorando la estrategia con que los intérpretes 
utilizan el conocimiento lógico al ejecutar los programas. Ya hemos visto en la 
sección anterior ejemplos de cómo el mero orden en la escritura de los programas 
puede cambiar profundamente su forma de ejecución. Ninguna mejora de los 
programas surge por ignorar la diferencia entre lógica y control, sino por mantener 
ambos componentes separados conceptualmente para saber exactamente sobre qué 
se está actuando en cada momento. Éste es el sentido original de la famosa 
ecuación de Kowalski. Los mecanismos que aquí se van a considerar son otras 
formas, frecuentemente necesarias, de introducirse con mentalidad operativa o 
procedural en lo que en principio es puramente declarativo. 
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Nota 1. Aritmética 


PROLOG es un lenguaje con la misma potencia de los lenguajes más 
utilizados y conocidos. Esto quiere decir que todos los predicados y funciones de la 
aritmética se pueden definir mediante programas lógicos puros. Por ejemplo, si 
consideramos los números naturales como reiteradas aplicaciones de una función 
suc (“sucesor”) a la constante 0: 0, suc(0), suc(suc(0)), ... (informal, pero 
realmente una definición recursiva), la suma se puede definir también 
recursivamente por medio de un predicado suma(X,Y,Z) que significa que Z es la 
suma de X e Y: 


suma(X,0,X). 
suma(X,suc(Y ),suc(Z)):- suma(X, Y,Z). 


Sin embargo esta forma de aritmética es enormemente ineficiente y está 
proclamando abiertamente su artificio porque sabemos que cualquier ordenador 
incorpora físicamente la capacidad de realizar las operaciones aritméticas usuales 
con gran eficiencia. 


Por ello, los intérpretes de PROLOG permiten el trabajo con números sin 
necesidad de definiciones como las precedentes. Disponen de operadores y 
predicados predefinidos o adjuntos (son pequeños programas procedurales que 
conviven con los lógicos) tales como +,-,*,*, =,< que se pueden evaluar mediante 
el predicado is que se utiliza en la forma tı is t,, con tı una variable que no debe 
estar instanciada y tz una expresión aritmética que se evalúa asignándose su valor a 
tı. Nótese que en esta utilización de is se pierde la total flexibilidad en las 
asignaciones a variables propia de la programación lógica. En un átomo p(X,Y) no 
hay papeles privilegiados (de entrada o salida, por ejemplo) para X o Y. 


Así, la pertenencia de un número X a un intervalo abierto (Y,Z), si no está 
predefinida, se representa por 


pertenece (X,Y,Z):- X>Y, X<Z. 


y el factorial (predicado factorial(X,Y) “Y es el factorial de X”) que no falta en 
ningún tratado de la materia, se calcula recursivamente en la forma habitual: 


factorial(0,1). 
factorial(X,Y) :- X > 0, X; is X - 1, factorial(X,, Y,), Y is X *Y,. 
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Ejemplo 1. Control y el predicado corte 

Uno de los usos más llamativos y controvertidos del predicado predefinido 
! (“corte”) se hace tangible en el siguiente ejemplo. A continuación del mismo 
haremos una especificación precisa del predicado. 


Supongamos el siguiente programa P 


rı: justo:-bueno. 
r,: bueno:-azul. 


13: bueno:-bueno. 


justo 


azul bueno 


fallo T> 


azul bueno 


i 
1 

fallo T2 ; NTI 
' ` 


Figura 3.7 


donde se ha puesto “azul” como podría haberse puesto cualquier predicado que no 
se da nunca como hecho en el programa, y que, por lo que se refiere a su función 
de objetivo intermedio en r», nunca va a llevar al objetivo ‘bueno’ pues no unifica 
con ningún literal positivo. 
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De este programa no se deduce el objetivo ?-justo. que, por tanto, forma 
con P un conjunto satisfacible de cláusulas y genera el árbol SLD de la Figura 3.7 
que no contiene la cláusula vacía. Este árbol nunca se termina de examinar porque 
en los nodos fallo, “azul”, se asciende al anterior y se pasa a la siguiente rama que 
nace a la derecha de la actual. Un intérprete PROLOG no tendría una salida en 
tiempo finito y terminaría con algún tipo de mensaje error o desbordamiento de 


memoria. 


Si hubiésemos escrito el programa con el predicado corte de la siguiente 


forma 


rı: justo:-bueno. 


tf: bueno:-!,azul. 
rs: bueno:-bueno. 
justo 
Tı 
bueno 
n T3 
lazul bueno 
les V T2 T3 
azul !,azul bueno 
fallo les V T2 No 
azul !,azul bueno 
he 
fallo !esV tr! 
azul 
fallo 


Figura 3.8 
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el árbol SLD para el mismo objetivo,?- justo., sería muy similar, véase Figura 3.8 
(adelantemos que el predicado corte, !, siempre es verdadero, como si ! fuera un 
hecho del programa), pero, por la definición procedural del corte, cuando se 
asciende (porque ha habido un fallo) desde el primer nodo azul, en negrita, se 
ignoran todas las ramas que salen a la derecha de los nodos que contengan el corte 
! hasta, inclusive, el inmediatamente anterior a aquel en donde apareció el corte !. 
En nuestro ejemplo se ignora toda la rama que empieza en el tramo tachado y se 
ascenderá hasta el nodo raíz terminando la búsqueda con la salida “fracaso”. 


Como puede apreciarse en los ejemplos, el corte no tiene ninguna interpretación 
lógica o denotacional salvo que se comporta como un predicado que se evalúa 
como verdadero y produce como resolvente de una cláusula !, O,, O», ..., Ox la 
cláusula O,, O», ..., Ox. A efectos del algoritmo de exploración del árbol SLD, esa 
transición equivale a la existencia de un hecho de la forma ! en P y no es dificil 
modificar dicho algoritmo para que actúe así. 


Nota 2. Significado procedural del predicado corte 


La interpretación operativa o procedural es la que muestra el carácter 
propio del corte: 


el corte es un átomo que siempre figura en un literal negativo; que, 


cuando llega a ser el primer objetivo de una cláusula negativa !, O,, Ox ..., Op 
se evalúa como cierto en el sentido arriba definido; y que 
e si se encuentra en un nodo etiquetado de esa forma !, O,, O», ..., Ox en una 


vuelta atrás prescrita por la resolución PROLOG, ésta se modifica 
imponiendo un “fallo”, imposibilidad de cualquier unificación, en ese nodo y 
en todos sus ascendientes mientras su etiqueta contenga el corte, hasta, 
inclusive, el inmediatamente anterior a aquel en donde apareció el corte !. 


Es claro que la nítida diferencia entre lógica y control que apreciábamos en 
la programación lógica se desdibuja en el predicado corte y que, al utilizarlo, el 
programador ya no trabaja en modo puramente declarativo sino un poco más en 
modo procedural. 


Otra aplicación no menos eficiente del predicado corte es la de ahorrar 
búsquedas adicionales cuando se ha alcanzado una solución para el objetivo 
planteado, más aún si esa solución se sabe que es la única. 


Por ejemplo, el programa 
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rı: actividad el(viaje,X):-10<=X. 

Tt: actividad _el(playa,X):-8<=X,X=<9, 
13: actividad _el(sierra,X):-6<=X,X=<7. 
ra: actividad _el(trabajo,X):-1<=X,X=<5. 


actividad_el(X,6) {} 
A Ls ee 
10<=6 (X/v) 8<=6,6<=9 (X/p) 6<=6,6=<7 (X/s) 1<=X,X=<5 (X,t) 
fallo fallo aritmética fallo 
6=<7 (X/s) 
aritmética 
a (X/s) 

Figura 3.9 


puede considerarse como una base de datos sobre actividades en determinados 
momentos etiquetados con números naturales (trabajo de lunes a viernes laborables 
normales, etiquetados del 1 al 5; ir a la sierra los fines de semana no puentes ni en 
vacaciones, 6 y 7; ir a la playa los puentes, 8 y 9; viajar en las vacaciones, 10 en 
adelante). Si se plantea el objetivo ?- actividad_el(X,6). se tiene el árbol de la 
Figura 3.9 (se han abreviado las constantes “viaje”, “playa”, “sierra” y “trabajo” 
por sus iniciales). 


Si tenemos en cuenta que la solución es única, sea 6 o cualquier otro 
número natural el asociado a la fecha, nos planteamos no seguir buscando a la 
derecha de la rama donde se encuentre la cláusula vacía. 


Entonces la modificación natural P” del programa P es 


tı: actividad el(viaje,X):-10<=X.!. 
t: actividad _el(playa,X):-8<=X,X=<9,!. 
13: actividad _el(sierra,X):-6<=X,X=<7,!. 
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Ta: actividad _el(trabajo,X):-1<=X,X=<5,!. 


que con el mismo objetivo, ?- actividad_el(X,6)., da lugar al arbol de la Figura 
3.10. donde una vez hallada la solución “sierra” ya no se exploran las ramas a la 
derecha de aquella en la que se ha encontrado. En este ejemplo sólo hay una rama 
así, pero se procedería igual cualquiera que fuera su número. 


actividad _el(X,6) {} 


T4 


6<=6,6=<7]! (X/s)  1<=X,X=<5,! (X/t) 
aritmẸtica fallo 
6=<7)1 (X/s| 
aritmética 
! (X/s) 


les V 


O (X/s 


Figura 3.10 


Con todavía mayor eficiencia (pero cada vez menos transparencia, sobre 
todo en una lectura en clave declarativa de la programación lógica) podríamos usar 
esta otra modificación, P””, 

rı: actividad el(viaje,X):-10<=X,!. 
rz actividad _el(playa,X):-8<=X,!. 
13: actividad _el(sierra,X):-6<=X,!. 
ra: actividad el(trabajo,X). 


Con el mismo objetivo, ?- actividad_el(X,6). y P””, no se exploran más 
ramas del árbol una vez alcanzado el objetivo, s de “sierra”, lo mismo que ocurría 
con P”. 
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actividad _el(X,6) {} 


10<=6,! (X/v) 8<=6,! (X/p) 6<=6,! (X/s) o (XA) 
fallo fallo aritmética 
! (X/s) 
Les V 
o (X/s) 
Figura 3.11 


Sin embargo, no deja de ser peculiar un árbol lógicamente correcto, Figura 
3.11, cuya última rama de la derecha el algoritmo no va a explorar, pero que es una 
deducción por resolución de que se practica el trabajo en fin de semana, parámetro 
6, cosa que va contra el sentido del programa primitivo P. 


Ejercicio 1. Escríbase un algoritmo que modifique el de la estrategia de 
PROLOG, sección 3.2.1, para que, manteniendo que se produzca la salida “éxito”, 
junto con la correspondiente sustitución, al encontrarse por primera vez la cláusula 
vacía, no se detenga ahí, sino que cambie al nodo ascendente del etiquetado con la 
cláusula vacía y vuelva a aplicar el procedimiento de forma que se recorran todas 
las ramas del árbol, salvo que alguna sea infinita, y que produzca la salida “éxito”, 
junto con la correspondiente sustitución, cuantas veces encuentre la cláusula vacía. 


APÉNDICE A 


DEFINICIONES Y DEMOSTRACIONES 
INDUCTIVAS 


Las definiciones y demostraciones inductivas tratan de captar y generalizar 
la esencia de la definición de los números naturales y de las inducciones 
elementales (que realmente son demostraciones por inducción sobre los números 
naturales). 


Desde este punto de vista, podemos considerar la siguiente definición del 
conjunto N de los números naturales: “el 0 es un número natural; y, si y es un 
número natural cualquiera, entonces y+1 también es un número natural”. (Nótese 
que, efectivamente, cualquier número natural está descrito por alguna de esas dos 
frases.) 


Por otra parte, como no deseamos que la definición incluya nada más que 
los números naturales, y ya los incluye con lo que tenemos hasta ahora, podemos 
añadir expresamente esa condición de que no abarque nada más: “no hay más 
números naturales que los que verifican las condiciones del párrafo anterior”, o 
bien “sólo son números naturales los que verifican las condiciones del párrafo 
anterior”, o bien “los números naturales son el conjunto mínimo que verifica las 
condiciones del párrafo anterior”. 


Se suele llamar cláusula básica o inicial a la frase “el 0 es un número 
natural”, cláusula inductiva a la frase “si y es un número natural cualquiera, 
entonces y+1 es un número natural” y cláusula final o terminal a la frase “sólo son 
números naturales los que verifican las dos cláusulas anteriores”. 
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Lo que se abstrae de esta definicion para el caso general es lo siguiente. La 
cláusula “el 0 es un número natural” se entiende como la afirmación de que los 
elementos de cierto conjunto, en este caso simplemente (0), están en N. La 
cláusula “si y es un número natural cualquiera, entonces y+1 también es un número 
natural” se entiende como la afirmación de que el resultado de aplicar ciertas 
funciones, en este caso sólo la función y+1, a elementos de N está en N. (Véase el 
Ejemplo 1 en A.1.) 


A.1 DEFINICIONES INDUCTIVAS 


Definición 1. Conjunto definido inductivamente 


Sea U un conjunto y B un subconjunto de U. Sea F un conjunto de 
funciones n-arias de U en U, n>0. Se dice que un subconjunto A C U está definido 
inductivamente sobre B por F o, simplemente, que A está definido inductivamente 
si 


(a) Los elementos de B están en A, 
(esta condición se llama cláusula básica o inicial y es donde se introducen 
los elementos más sencillos de A) 


(b) para toda función n-aria f de F y para toda n-tupla x, x, ..., x, de U six > 
us Xx, están en A, entonces f(x, X, ..., X,) está en A, 


(esta condición se llama cláusula inductiva y nos permite construir 
elementos complejos de A a partir de elementos más sencillos) 


z 
= 


(c) A es el conjunto mínimo que verifica (a) y (b), es decir, sólo son elementos 
de A los que verifican (a) o (b). 

(esta condición se llama cláusula final o terminal porque permite finalizar 
el análisis de si cierto objeto u está en A una vez que se han comprobado las 
condiciones (a) y (b) para u). 


Nota 1. Corrección de la definición inductiva 


Puesto que A se define como el mínimo subconjunto de U con las 
propiedades (a), (b) y (c), no es difícil demostrar que se puede obtener como 
intersección de todos los subconjuntos de U que verifican (a) y (b) y, por tanto, 
que, para cada definición inductiva, existe un único A que satisface las condiciones 
de la misma. 
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Ejemplo 1. El conjunto de los números naturales 


Sea U el conjunto de los números reales, B el conjunto {0} cuyo único 
elemento es el número cero y F el conjunto de un sólo elemento: la función unoaria 
s definida como s(x) = x+1 (la función sucesor). 


El conjunto A de los números naturales se define inductivamente así: 


(a) el 0 es un número natural, 
Es el caso particular, en este ejemplo, de: “los elementos de B están en A”. 


(b) si x es un número natural cualquiera, entonces x+1 es un número 
natural, 

Es el caso particular, en este ejemplo, de: “para toda 1-tupla (x) de 
elementos de U que están en A y para toda función f de F, f(x) está en A”. (s(x) 
=x+l es el único ejemplo de fx, Kop o x.) en este caso) 


(c) sólo son números naturales los definidos por (a) y (b). 
Es el caso particular de: “A es el conjunto mínimo que verifica (a) y (b)”. 


Ejemplo 2. El conjunto de términos de un lenguaje L de primer orden 
En este caso U es el conjunto de todas las expresiones de L (cadenas finitas 
de símbolos de L). B es el conjunto de las variables de L. En F hay una función a 


por cada símbolo de función n-aria, g, de L. La función f aplica U” en U y está 
definida como sigue: 


f, (a, o a) caja. a 


n 


Se podria decir que el efecto de E es construir los términos que empiezan 
por g, que en ocasiones se denomina el constructor del término g a,a, ... a,. 


La definición inductiva del conjunto A de los términos es 


(a) Toda variable es un término, 

Es el caso particular, en este ejemplo, de: “los elementos de B están en A”. 
(b) si a,, a,, ..., a, son términos cualesquiera y g es un símbolo de función n- 
aria cualquiera, entonces g a 13, a, eS UN término, 

Es el caso particular, en este ejemplo, de: “para toda n-tupla x,, x,, ..., x, de 
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elementos de U que están en A y para toda función f de F, f(x, ee x) esta en 


A”, £ (a, A a) = gaa, ... a, para los diversos simbolos g, son, en este 
caso, las funciones f(x,, X,, ..., X,). 


(c) sólo son términos las expresiones definidas por (a) y (b). 
Es el caso particular de: “A es el conjunto mínimo que verifica (a) y (b)”. 


Ejemplo 3. El conjunto de los teoremas de una teoría de primer orden 


En este caso U es el conjunto de todas las fórmulas de L(T) donde T es la 
teoría en cuestión, B es el conjunto de los axiomas de T y F está formado por las 
funciones f,, fo f, f, (unoarias) y f (binaria) definidas como sigue. Nótese que, 
si el argumento de una función es la premisa de una de las cinco reglas lógicas de 
toda teoría de primer orden, el valor de la función es precisamente la conclusión de 
esa regla. El nombre de la regla correspondiente está a la derecha de cada función. 


E (C)= BvC expansión con B, 
f D= B si D es B v B 

indefinida en otro caso contracción, 
fa) (AvB)vC siDes A v(B vC) 

indefinida en otro caso asociativa, 
£ DF HxA>B si Des A > B y x no libre en B 

indefinida en otro caso introducción del 3 
f(D, E)= BvC siDesAvByEes=AvC 

indefinida en otro caso corte, 


La definición inductiva del conjunto A de los teoremas es 


(a) Todo axioma es un teorema, 
Es el caso particular, en este ejemplo, de: “los elementos de B están en A”. 


(b) si, respectivamente, C, B v B, A v (B v C), A > B (con x no libre en B 
en este caso), y, finalmente, A v B y — A v C son teoremas entonces, 
respectivamente, BvC, B, (AvB) v C, 3x A > B y B v C son teoremas, 
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Es el caso particular, en este ejemplo, de: “para toda 1-tupla (x) y para toda 
2-tupla (X,, x,) de elementos de A y para toda función f de F, f(x, Xa en x) esta 
en A”. En este caso, las funciones f(x, Ha. x,) son f,(C), de (D), r (D), f(D) 
y £(D, E). 


(c) sólo son teoremas las fórmulas definidas por (a) y (b). 
Es el caso particular de: “A es el conjunto mínimo que verifica (a) y (b)”. 


Ejemplo 4. La ejecución de un programa 


Consideremos, por ejemplo, el “Programa que suma los números naturales 
x e y (añadiendo a x tantos 1’s como indique el valor de y) y deja el resultado en z” 


begin 

1 z=x 

2 u=0 

3 while u +y do 

4 begin z:= suc(z); u:= suc(u) end 
end 


y supongamos que se ejecuta con la entrada x = 3 e y =2. La ejecución procede por 
pasos que consisten en: asignar a la variable interna z el valor de x (3 en este caso); 
inicializar otra variable interna u en cero; comparar u con y (inicio de un bucle), si 
no son iguales incrementar z y u en una unidad (instrucción sucesor) y volver al 
comienzo del bucle: comparar u con y. Se entra al bucle tres veces hasta que u vale 
2, es igual a y; z, que era x, o sea 3, se ha incrementado en tantas unidades como 
indica u, que ya vale lo mismo que y, 2; se sale del bucle y el programa termina 
con x+ y, 3+2, en Z. 


Este proceso se puede representar por la sucesión de valores que toman las 
variables x, y, z, u y una nueva variable, s;, que lleva el control de cuál es la 
“siguiente instrucción” que se va a ejecutar tras i pasos ya ejecutados, con el 
convenio de que al terminar, cuando ya no hay siguiente instrucción, s; toma el 
valor 0. 
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x y z u Si 
3 2 - - 1 paso 0 
3 2 3 - 2 paso 1 
3 2 3 0 3 paso 2 
3 2 3 0 4 paso 3 
3 A 4 1 ki paso 4 
3 2 4 1 4 paso 5 
3 2 5 2 3 paso 6 
3 2 5 2 0 paso 7 


Llamemos estado de la ejecución a cada una de las líneas de la tabla 
precedente. 


En general, la ejecución, sin paralelismo, de un programa P con cierta 
entrada y en cierta máquina se puede entender como una generalización del 
proceso que hemos visto en el ejemplo anterior. La ejecución es secuencial. Esto 
quiere decir que las instrucciones se ejecutan de una en una y en un orden preciso. 
Llamemos paso a cada una de esas ejecuciones individuales. En cada paso, p, se 
modifican diversos elementos de la máquina tales como su memoria, la identifica- 
ción de si el programa se ha detenido o no y, en este caso, la identificación de la 
instrucción de P que se ha de ejecutar en el paso siguiente. Llamamos estado de la 
ejecución en el paso p a la descripción completa de todos esos elementos a los que 
nos acabamos de referir. En lo que sigue identificaremos la ejecución de P con el 
conjunto de sus estados y es éste el conjunto que puede definirse inductivamente. 
La especificación de los conjuntos U, B y F es necesariamente informal por la 
generalidad del planteamiento: hablamos de un programa escrito en un lenguaje 
cualquiera y de una máquina cualquiera. 


U es el conjunto de todos los posibles estados de la ejecución de P. B es el 
conjunto cuyo único elemento es el estado inicial (estado en el paso 0, cuando la 
memoria sólo contiene la entrada y se va a ejecutar la primera instrucción). F es un 
conjunto finito de funciones. Cada función está asociada a una instrucción de P y 
tiene el efecto de modificar el estado en que actúa según la semántica de la 
correspondiente instrucción. Entonces 


El subconjunto A C U (de los estados de la) ejecución del programa P 
es el subconjunto definido inductivamente sobre B por F. 
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A.2 DEMOSTRACIONES INDUCTIVAS 


En la inducción elemental se prueba que cierta propiedad se verifica para 
todo número natural n demostrando que se verifica para n=0 y que, si se verifica 
para un n arbitrario, también se verifica para n+1. 


Lo que se abstrae de esta forma de prueba para el caso general es el 
siguiente esquema: (a) demostrar que los elementos de cierto conjunto, en este caso 
simplemente (0), cumplen la propiedad; y (b) demostrar que si un n cumple la 
propiedad, el resultado, n+1, de aplicarle ciertas funciones, en este caso sólo la 
función x+1, también cumple la propiedad. (Véase el Ejemplo 1 más abajo). 


Definición 1. Demostración por inducción 


Se dice que se ha demostrado por inducción que todos los elementos de un 
subconjunto A de U definido inductivamente (sobre B por F) tienen cierta 
propiedad P, definida en A, si se ha probado lo siguiente. 


(a) La propiedad P se verifica para todo elemento x de B, P(x), 
(b) para toda función n-aria f de F y para toda n-tupla x , x, ..., x, de 


elementos de A, si la propiedad P se verifica cada uno de los Xx, X, ..., X 
P(x), P(x), ... P(x,), entonces la propiedad P se verifica para f(x, Xy ..., 
MIE (ex ey) 


La condición P(x,), P(x,), ... P(x,) del antecedente de la implicación 
anterior se llama hipótesis de inducción. 


Nota 1. Principio de inducción 


Cuando se lleva a cabo una demostración como la anterior, se prueba que 
el subconjunto A’ de U formado por los elementos de A que tienen la propiedad P, 
(i) contiene a B y que (ii) para toda función n-aria f de F y toda n-tupla x,, x,, ..., X, 
de A”, fx Xin x) está en A”. Puesto que, por definición, A es el mínimo 
conjunto que verifica esas dos condiciones, A C A”, y como, por definición A’ C 
A, A = A’ y efectivamente, P(x) para todo elemento x de A. Esta propiedad de las 
demostraciones por inducción se conoce como el Principio de inducción. 
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Ejemplo 1. Esquema de la demostración del teorema del binomio de 
Newton 


Se quiere demostrar que, para todo número n, (atb)" = (n!/(O!n!))a "b ue 
nl, 1 
(n!/(1!(n-1)!))ja b +... (enunciado del teorema del binomio de Newton). 


Aquí entendemos que la igualdad anterior es la propiedad P que queremos 
demostrar para todo número natural n. En este caso, el conjunto A es el de los 
números naturales, Ejemplo 1 de la sección anterior, B = {0} y F = {s}. 


Los pasos que habrá que seguir son los siguientes. 


(a) Demostrar que (a+b) = (0/(010))a b. (se verifica P(0)) 


(b) Demostrar que, si (a+b)” = (nl/(Olnija'b + (ni/(lM-DI)a” b + 
hipótesis de inducción, P(n), 


entonces (a+b) = (nt) Ont) ab + (M+NUAID)a "b + ... 
(P(s(n)), es decir, P(n+1)). 


Ejemplo 2. Esquema de la demostración del teorema de validez 


Si se quiere demostrar que todo teorema de T es válido en T (enunciado del 
teorema de validez), se trata de probar que la propiedad P(x) “x es una fórmula 
válida en T” se verifica par todos los elementos del conjunto A de los teoremas de 
T, definido inductivamente sobre los conjuntos B y F que se detallan en el Ejemplo 
3 de la sección anterior. Por tanto habrá que demostrar lo siguiente 


(a) Todo axioma de T es válido en T. 
Se verifica P(x) para las fórmulas x de B, los axiomas 


(b) Si, respectivamente, C, B vB, A v (B v C), A >B (con x no libre en B en 
este caso), y, finalmente, A vB y 4A vC son válidas en T, 
Se cumple la hipótesis de inducción: P(x) o P(x,, x,) para las fórmulas, (x), 


o pares de fórmulas, (x,, X) que se citan 
entonces BVC, B, (A vB) VC, HA >B y B vC son válidas en T. 


Se tiene (P(f(x)) o P(f(x,,x,)) para las funciones f,, f., f, £, (unoarias) y f, 
(binaria) (definidas en el ejemplo de la sección anterior) y las fórmulas, (x), o 
pares de fórmulas, (x,, X,), que se citan. 
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Véase la propia demostración en 1.3.3. 
Nota 2. Demostración de propiedades generales de programas 


La Definición 4 de A.1 junto con esta sección A.2 constituyen una técnica 
privilegiada para demostrar con todo rigor propiedades muy generales de 
programas tales como la conservación de un invariante en cualquier ejecución de 
todos los programas de cierta clase. 


Apéndice B 


ADECUACIÓN DE LAS TABLAS ANALÍTICAS 


Teorema. Corrección y completud de las tablas analíticas 


El cálculo de las tablas analíticas es correcto y completo en el sentido de 
que un conjunto finito de fórmulas cerradas I puede ser refutado si y sólo si la 
teoría cuyos axiomas no lógicos son las fórmulas de I es inconsistente. 


La demostración de la corrección, “sólo si”, es un buen ejercicio de 
aplicación de lo aprendido en el Capítulo 1 y como tal se incluye aquí. La 
demostración de la completud (si I es inconsistente, hay una refutación de I) es 
más compleja, no es constructiva y no proporciona un método efectivo finito de 
comprobación de la existencia de la refutación cuya existencia se afirma, sólo una 
especificación de la búsqueda de la misma, pero sin forma de saber cuándo 
terminará. El lector interesado puede obtenerla a partir, por ejemplo, del resultado 
semántico paralelo que presenta (Bell, Machover, 1977). 


El desconocimiento del momento de terminación va asociado con la 
condición de parcialmente decidible que se da en el problema de la decisión sobre 
un teorema, véase 1.4, Teorema 3, y ha de ser tratado por estrategias concretas de 
la forma en que se plantee la búsqueda, como hemos visto en el caso de la 
programación lógica y PROLOG. 
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Demostración de la corrección 


Nota. Para no recargar la notación y cuando no haya lugar a confusión, 
podemos escribir {I} en lugar de T[[] y T F ... enlugarde T[F] F is 


Hemos de probar que si T tiene una refutación, entonces la teoría cuyos 
axiomas no lógicos son las fórmulas de T es inconsistente. Haremos la demostración 
por inducción sobre la profundidad p de la refutación de T. 


Caso p=0 


Si p=0, entonces I debe contener una fórmula A y su negación > A y, por 
tanto, T[I’] es inconsistente. 


Caso p>0 
Vamos a examinar el nivel 1 de la refutación dada. (En general, el nivel 1 
no tiene por qué ser el último). Distinguimos los siguientes casos según la regla 


que dio lugar a dicho nivel 1. 


(al) Caso en el que el nodo de nivel 1 se haya obtenido por aplicación de 
la regla == 


Pas 


Hay un solo nodo, B, en el nivel 1 resultado de aplicar la regla >> a una 
fórmula ~~ B de T. Recuérdese que en el nivel 0 sólo está T. 


Si suprimimos el nodo B y lo colocamos con T en el nodo inicial, 


T,B 


Ris 


lo que se obtiene es una refutación de profundidad p-1 para (T, B}. Por hipótesis 
de inducción, {I', B} es inconsistente, podemos deducir cualquier fórmula. Por 
tanto, 
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T,B }-B 
(recuérdese que esto es una abreviatura de T[[, B] |— — B). Por la regla de 
deducción, 
rT -B>-B 


(estamos suponiendo que todas las fórmulas de T son cerradas, ~~ B es una de ellas 
y, si > B es cerrada, B también es cerrada). Por el teorema de tautologia, 


r }-B 


(~ B es consecuencia tautológica de B > — B: — B v — B). Como también se tiene 
que, por estar -~ B en T, 


p ho B, y, consecuentemente, I es inconsistente. 


(a2) Casos en que los nodos de nivel 1 se hayan obtenido por aplicación de 
la regla A >B, > (A a B), o A vB 


En el primer caso hay dos nodos, =A y B, en el nivel 1 resultado de aplicar 
la regla —> a una fórmula A > B de T (en los casos >(A ^ B) y A v B se razona 
en forma análoga). 


Tr. 
ae ass 
| 
Ro. S 


Ahora suprimimos el nodo B y todos los que le siguen (los que están en la 
rama que empieza en B), suprimimos también el nodo — A y lo colocamos con TP en 
el nodo inicial. 


FA 
Rs. 


Lo que se obtiene es una refutación de profundidad p-1 para T, >A. Luego, 
por hipótesis de inducción, I, =A es inconsistente. Análogamente, se obtiene 
también que T, B es inconsistente, podemos deducir cualquier fórmula. En 
particular, 
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DA FA, T,B E-B. 
Por la regla de deducción, 
r --A>A, T }B>7-B 
y, por el teorema de tautologia, 
TRA, rþ-B, PAA-B y Tr F>(AvB). 
Como también se tiene, por estar A > B en T, que 
TFa>B TA vB, 
T es inconsistente, se ha deducido una fórmula, > A v B, y su negación. 


(a3) Casos en que el nodo de nivel 1 se haya obtenido por aplicación de la 
regla — (A > B), A A B, o ` (A vB) 


En el primer caso hay un solo nodo, A, — B, en el nivel 1 resultado de 
aplicar la regla > > a una fórmula > (A > B) de T (los casos A A B y ~ (A v B) se 
razonan de forma análoga). Si suprimimos el nodo A, — B y lo colocamos con T en 
el nodo inicial, lo que se obtiene es una refutación de profundidad p-1 para T, A, 
—B. Por hipótesis de inducción, T, A, -B es inconsistente, podemos deducir 
cualquier fórmula. Por tanto, 


T,A,B LA>B. 
Por la regla de deducción se tiene que 
TLa>-B>A>B 
y, por el teorema de tautología, 


E Ha >B (A—>B, que es ~AvB, es consecuencia tautológica de A > -B > 
A > B, que es ~A v —B v ~A v B). 


Como también se tiene que, por estar ~ (A > B) en T, 


r H-A >B), 
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T es inconsistente. 


(b1) Casos en que el nodo de nivel 1 se haya obtenido por aplicación de la 
regla Vo =J 


En el primer caso hay un solo nodo, Pt, en el nivel 1 resultado de aplicar la 
regla V a una fórmula VxP de I (el caso -3x P se razona análogamente). Si 
suprimimos el nodo Pt y lo colocamos con I en el nodo inicial, lo que se obtiene es 
una refutación de profundidad p-1 para (T, Pt}. Por hipótesis de inducción, T[P,Pt] 
es inconsistente. Si llamamos T, a T[F] y Q al cierre de Pt, T[P, Pt] es T,[Pt], 
inconsistente, y también T¡[Q], (Ejercicio 8 de 1.1.3). Aplicando el teorema de 
reducción al absurdo, Teorema 3 de 1.1.3, 


Ty H-Q, 


Pero también se tiene que, por estar VxP en I y por el teorema de 
sustitución, 


Tı } Pt, y, por la regla del cierre, 
T, FQ. 
Luego T, es decir, T[I'], es inconsistente. 


(b2) Casos en que el nodo de nivel 1 se haya obtenido por aplicación de la 
regla Jo >Y 


En el primer caso hay un solo nodo, Pe, en el nivel 1 resultado de aplicar la 
regla 3 a una fórmula 3xP de T' (el caso Vx P se razona análogamente). Si 
suprimimos el nodo Pe y lo colocamos con F en el nodo inicial, lo que se obtiene 
es una refutación de profundidad p-1 para (T, Pe}. Por hipótesis de inducción, 
T.[I’, Pe] es inconsistente (ponemos Te porque, al aplicar la regla 3 a la fórmula 
xP, el efecto sobre T es añadir la constante nueva e), podemos deducir cualquier 
fórmula, en particular 


TIE Pel H-a xP, entonces, 
TAD} F Pe —-3xP por la regla de deducción, 


TIT] H P>-—3xP por la regla de constantes, 
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TIT] F 3xP > —3xP por la regla de introducción del cuantificador 
existencial y 


TIT] H 3 x P por el teorema de tautologia. 
Como también se tiene que, por estar 3 x P en T, 
TIT] } 3xP, 


T[I] es inconsistente. n 


Apéndice C 


CONSIDERACIONES ELEMENTALES SOBRE 
LA REPRESENTACION DEL CONOCIMIENTO 
CON LENGUAJES DE PRIMER ORDEN 


El título de este Apéndice apunta al carácter práctico y elemental del 
mismo que, en ninguna forma, debe entenderse como una introducción a la 
representación del conocimiento en Inteligencia Artificial. Dicha disciplina está 
claramente fuera del tema de esta monografía y el lector interesado encontrará sin 
ninguna dificultad una abundante lista de extensas y excelentes referencias sobre la 
misma. 


C.1 PREPARACIÓN 


Definición 1. Formalización o representación del lenguaje natural 


La representación en lógica de primer orden del conocimiento que se nos 
proporciona en lenguaje natural es el proceso por el que de una o varias frases se 
obtiene un conjunto de fórmulas de un lenguaje de primer orden L, una de cuyas 
semánticas es precisamente el conjunto de dichas frases del que se han eliminado 
las ambigúedades por convenios como los que siguen. 


Definición 2. Convenios 
Puesto que el lenguaje natural es mucho más expresivo que los lenguajes 


de primer orden, hay que adoptar convenios sobre el significado de las conectivas y 
cuantificadores, qué conectiva representa qué relación entre oraciones simples. 
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Cualquier convenio reduce la expresividad del lenguaje, pero es la única forma de 
obviar la ambigiiedad, al menos en el contexto de la Lógica clásica. Los ejemplos 
más usuales de un posible convenio son los siguientes: 


A A B representa las oraciones compuestas: A y B, A pero (o aunque) B, A y 
sin embargo B, A que (también) B, A porque B, etc. 


A v B representa las oraciones compuestas: A o B o ambos, AoB,oAoB,Aa 
menos que B, al menos A o B, etc. 


— A representa las oraciones: no A, no ocurre A, es falso que A, etc. 


A © B representa las oraciones compuestas: A si y sólo si B, A equivale a B, 
A(B) necesario y suficiente para B(A), etc. 


A > B representa las oraciones compuestas: si A entonces B, si A, B; A 
suficiente para B, B necesario para A, A sólo si B, B si A, no A a menos que B, 
etc. 


(A vB) ^aa (A AB), “o” exclusivo, sólo se emplea si está explícito en la frase 
“Duermo o estudio, pero no hago las dos cosas a la vez” 


dx A representa las oraciones: alguien verifica A, algunos verifican A, existe, 
hay, alguien que verifica A; se verifica A para algún individuo x, etc. 


Vx A representa las oraciones: todos verifican A, todo individuo x verifica A, A 
se cumple para todos, etc. 


Nota 1. Predicados o proposiciones 


El significado de las frases que pretendemos representar define un dominio 
cuyos individuos son aquellos que aparecen como sujetos u objetos de dichas frases 
y cuyos predicados se forman a partir de las afirmaciones o negaciones de las 
mismas. 


En este paso hay que decidir si para la representación de esos predicados es 
necesario utilizar símbolos de predicado n-arios, n>0 (lógica de predicados) o sólo 
símbolos de predicado 0-arios (lógica de proposiciones). El primer caso se 
caracteriza porque una misma propiedad se expresa aplicada a diversos individuos, 
por ejemplo: P(a), P(b); o unas veces a individuos genéricos y otras a individuos 
concretos, por ejemplo: —P(a), 3x P(x); y porque, habitualmente, la complejidad de 
las frases nos lleva a la utilización de variables o variables sustituidas por 
constantes. El segundo caso no es así: se tienen p, q, m (propiedades simples 
distintas atribuidas o no a algún individuo o individuos, pero siempre de la misma 
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forma) y la veracidad de las frases es independiente de la estructura interna de p, q, 
m; resulta únicamente de que cada una sea verdadera o falsa y de la forma en que 
se combinan en frases compuestas. 


Ejemplos en que se adoptan símbolos de predicado. Las siguientes frases se 
representan por las fórmulas que se indican. 


Juan reposta gasolina, Pepe no reposta gasolina RG), =R(p) 
Juan reposta gasolina, nadie reposta gasolina RG), VxR(x) 
Nadie reposta gasolina, algunos repostan gasolina VxR(j), 3xR(x). 


Ejemplo en que se adoptan símbolos de proposición. La frase “Si Juan 
reposta gasolina entonces Pepe corre en bicicleta y nadie roba” se representa por 
la formula j > (p An). 


Esta elección entre proposiciones o predicados es muy conveniente para 
que el problema de que se trate se resuelva eficientemente. Como ya vimos, cuando 
es posible representarlo en lógica de proposiciones, la representación y su 
tratamiento posterior son mucho más sencillos que si nos vemos obligados a 
utilizar símbolos de predicado de aridad mayor que 0. Los problemas reales que 
admiten este tratamiento no son pocos y esto justifica plenamente la distinción que 
estamos haciendo. No obstante, es claro que por la propia naturaleza del 
conocimiento, son muchos más los casos en que no puede obviarse la lógica de 
predicados. 


Nota 2. Definición del lenguaje 


Como ya se ha dicho, el significado de las frases nos define un dominio 
con sus individuos y predicados. Aunque no sea lo más habitual, ciertos incisos 
pueden dar lugar a funciones como “el padre de a” o “la pareja formada por a y b”. 


Como en cualquier otro contexto, el lenguaje de primer orden L que se va a 
usar está definido cuando se especifican sus símbolos no lógicos: 


e constantes (una para cada individuo del dominio que se está considerando) 

e simbolos de predicado (uno por cada predicado de dicho dominio) 

e simbolos de función (uno por cada función del mismo dominio) que, como 
hemos apuntado, no aparecen más que en raras ocasiones. 
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C.2 REPRESENTACIÓN 


Dado el carácter elemental de este capítulo, no vamos a tratar más que 
oraciones sin construcciones muy complicadas. Esto, junto con los pasos 
anteriores, hacen que la representación efectiva de las frases sea bastante sencilla y 
casi mecánica, salvo por lo que se refiere al uso de cuantificadores que depende en 
gran medida del dominio que hayamos definido previamente. La frase “todos los 
hombres sois iguales” se puede representar por Vx I(x), o por, Vx(V(x) > I(x)) o 
por, Vx(H(x) A V(x) > I(x)), donde el símbolo I representa el predicado “ser 
igual” (en el sentido familiar de la frase), V el predicado “ser varón” y H el 
predicado “ser un humano”. La diferencia entre las tres representaciones radica en 
que el dominio consiste en los hombres varones, en el primer caso, los seres 
humanos, en el segundo, y todos los seres en el tercero. 


En los siguientes ejemplos mostramos cómo el único trabajo de la 
representación es la combinación en una o varias fórmulas de los símbolos que 
hemos ido introduciendo y comentando en lo que antecede. 


Ejemplo 1. Representación en cálculo de proposiciones 


Estudiamos las siguientes frases, tradicionalmente citadas como un 
fragmento del Estudio en escarlata de Arthur Conan Doyle, donde pensamos que 
se presentan gran parte de las situaciones con las que puede encontrarse el lector en 
este nivel. 


“Y ahora llegamos a la gran pregunta del por qué. El robo no ha sido el 
objeto del asesinato, puesto que nada desapareció. ¿Fue por motivos políticos o fue 
una mujer? Ésta es la pregunta con la que me enfrento. Desde el principio me he 
inclinado hacia esta última suposición. Los asesinos políticos se complacen 
demasiado en hacer sólo su trabajo y huir. Este asesinato, por el contrario, había 
sido realizado muy deliberadamente, y quien lo perpetró ha dejado huellas por 
toda la habitación, mostrando que estuvo ahí todo el tiempo.” 


Las siguientes correspondencias de símbolos y predicados deben dejar 
claro que en este ejemplo basta una representación en lógica proposicional. 


Elección de un lenguaje: pondremos los símbolos (r, d, p, m, h, hh) para 
representar, respectivamente, las frases “Fue un robo”, “Algo desapareció”, “Fue 
un crimen político”, “Lo hizo una mujer”, “El asesino huyó inmediatamente”, “El 
asesino dejó huellas por toda... >”. 
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En este contexto, consideramos la oración “El asesino estuvo ahí todo el 
tiempo” como la negación de “huyó”. 


Con ello, la representación de las frases no puramente retóricas (como 
“Y ahora llegamos a la gran pregunta del por qué”) puede ser así: En la oración 
“El robo no ha sido el objeto del asesinato, puesto que nada desapareció” hay 
una afirmación incondicional implícita (“nada desapareció”) ad y, ademas 
explícitamente, es una afirmación condicional ~d > =r. 


Nótese que tanto desde el punto de vista lógico como lingüístico, también 
podria ponerse sólo —r; porque se deduce por modus ponens de las dos fórmulas que 
ya tenemos y también porque puede estimarse que está implícita en la frase. Sin 
embargo, optamos por ~d > —r porque no podemos ignorar la estructura de la frase 
completa y arriesgarnos a falsear la representación al utilizar sólo información 
implicita. 


La frase “¿Fue por motivos políticos o fue una mujer?” es retórica en 
cuanto que pregunta, puesto que todo el contexto da a entender que Sherlock 
Holmes no admite más que esas dos posibilidades y así, en realidad, está afirmando 
pym. 


Es más, él ya ha deducido m. Nosotros la pondremos entre interrogantes 
¿m? para indicar que todavia tenemos que hacer la deducción de esa fórmula como 
teorema en la teoría cuyos axiomas sean el resto de las frases. 


Por lo que se refiere a “Los asesinos politicos se complacen demasiado en 
hacer sólo su trabajo y huir”, como ocurría en el ejemplo “todos los hombres sois 
iguales” o en cualquier frase “todos los X son, o hacen, Y”, lo que subyace es que 
ser X implica ser, o hacer, Y. Por eso la representamos por la fórmula p > h. 


Finalmente, la frase “Este asesinato, por el contrario, había sido realizado 
muy deliberadamente, y quien lo perpetró ha dejado huellas por toda la 
habitación, mostrando que estuvo ahí todo el tiempo” es parecida a la primera, con 
una afirmación incondicional, hh, y otra condicional, con la misma observación 
que hicimos sobre la alternativa de tomarlo como dos incondicionales, hh > ~h. 


Ejercicio 1. Demuéstrese que 
T[-d, ad > <r, p v m, p> h, hh, hh > sh] F m. 


Las consideraciones del apartado anterior nos ahorran su repetición en los 
ejemplos siguientes que nos parecen suficientemente claros. 
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Ejemplo 2. Representación en cálculo de predicados 

Todo amante de los animales que sea aficionado al golf disfruta del 
campo. Hay quien no disfruta del campo aunque ame a los animales. ¿Hay 
personas no aficionadas al golf? 


Lenguaje con símbolos de predicado 1-ario: A, G, C. 
Representación: Vx(A(x) A G(x) > C(x)), IX(7C(%) A A(x); ¿ Ix G(x)? 


Ejemplo 3. Representación en cálculo de predicados. Alguien ha 
ganado cien millones. Cualquiera que haya ganado cien millones es rico. ¿Alguien 
es rico? 


Lenguaje con símbolos de predicado 1-ario: G, R. 


Representación: 3x G(x), Vx(G(x) > R(x)); ¿ dx R(x)? 


Ejercicio 2. Demuéstrese que 


T[Vx(A(x) A G(x) > C(x)), 4x (AC(x) A A(x))] H Ax G(x) 


T[Ex G(x), Vx(G(x) > R(x))] Fax R(x). 


Nota final 


Hemos llegado al cabo del camino que empezó en los principios 
elementales de la Lógica y nos ha dejado en los fundamentos teóricos no tan 
elementales de la programación lógica con algunos ejemplos de PROLOG. Aunque 
no sea eterno y grácil, el bucle se ha cerrado y esperamos que provechosamente. 
Los lectores para los que esto sólo era un comienzo y aquellos a los que haya 
despertado el apetito de más conocimiento pueden escribir sus programas propios, 
y tan sencillos como quieran, con el Prolog SWI, un software de libre distribución 
(www.swi-prolog.org) con manual de fácil lectura y uso; o asomarse a los textos de 
(Clocksin, Mellish, 1994), (Lloyd, 1991), (Hogger, 1990) y (Gabbay et al., 1993); 
o seguir cursos más avanzados de lenguajes de programación lógica, programación 
declarativa, lógicas no clásicas; o varias de todas esas posibilidades. 


Para este autor ha sido un placer. 
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